微信数据分析笔记

6月24日

项目需求分析

1、男女性别比例

2、各省好友数量

3、个性签名云图

第三方库

pyecharts

一个商业级图表,纯Js图表库。用于生成Echarts图表的类库。

jieba

中文分词组件。

scipy

工程设计的Python工具包。包括统计、优化、整合、线性代数模块、傅里叶变换、信号和图像处理、长积分方程求解器等等。

wordcloud

Python词云展示库,在一段文本中提取关键词进行扁平化的展示,更能吸引目标客户的眼球。

wxpy

微信个人API

re

Python的re模块提供了诸多正则表达式模块,使Python拥有了全部的正则表达式功能,库1方便检查一个字符串是否与某种模式匹配。

登录并查看相关信息

1、登录

bot = Bot() #扫描二维码自动登录

2、获取登录账号的所有好友

bot.friends()

3、获取当前登录账号所关注的公众号

bot.mps()

4、获取当前登录账号群聊列表

bot.groups()

5、搜索好友:

bot.friends().search(‘好友备注名’)[0]

6、搜索好友并发送消息

bot.friends().search(‘好友备注名’)[0].send(‘str’)

7、向文件传输助手发送信息

bot.fle_helper.send(‘str’)

字典

1、每个键值(key:value)对用冒号分隔

1
2
3
4
5
>>>s = {'name':'udbs', 'age':20}
>>>a['age']
20
>>>print(a['age'])
20

访问字典

字典名[‘key’]

修改字典

字典名[‘key’] = ‘value’

删除字典

1、删除单一元素

格式:del 字典名[‘key’]

2、清空所有元素

格式:字典名.clear()

3、删除字典

格式:del 字典名

6月25日

读写文件

open函数,必须先用Python内置的open()函数打开文件,创建一个file对象。

1
file object = open(file_name[, access_mode][, buffering])

with as语句

try-finally语句可以处理异常。但较麻烦。

python提供了with语句语法,来构建对资源创建与释放方法,但功能与try相似。with语句后面跟着open方法,如果有返回值,可以使用as语句赋值给变量,退出时自动调用close。

re模块

re.findall()方法

搜索整个字符串,返回匹配正则表达式的所有内容。

1
re.findall(pattern,string)

re.compile()方法

将正则字符串编译成正则表达式对象,以便后期匹配中复用。

1
re.compile('正则表达式')

正则表达式

  • .匹配除了换行符之外的所有字符。
  • d数字
  • w字母

join()方法

用于将序列中的元素以指定的字符连接生成一个新的字符串

6月26日

jieba库

  1. 精确模式:jieba.lcut(str)

    试图将语句最精确切分,不存在冗余数据,适合文本分析。

  2. 全模式:jieba.lcut(str,cut_all=True)

    将与句中所有可能是词的词语都切分出来,速度快,但存在冗余数据

  3. 搜索引擎模式:jieba.lcut_for_search(str)

    在精确模式的基础上·,对长词再次进行切分。

1
2
3
4
5
6
7
8
9
>>> str = '手持两把锟斤拷'
>>> jieba.lcut(str)
['手持', '两把', '锟', '斤', '拷']
>>> str = '手持两把锟斤拷,口中直呼烫烫烫。'
>>> jieba.lcut(str)
['手持', '两把', '锟', '斤', '拷', ',', '口中', '直呼', '烫烫', '烫', '。']
>>> jieba.lcut_for_search(str)
['手持', '两把', '锟', '斤', '拷', ',', '口中', '直呼', '烫烫', '烫', '。']
>>>

筛选函数isin()函数

isin()

功能:判断该列元素是否在某一个列表中。是True,否False。

groupby函数和agg函数

agg基于列的聚合操作

groupby基于行


文章结束了,但我们的故事还在继续
坚持原创技术分享,您的支持将鼓励我继续创作!