6月24日
项目需求分析
1、男女性别比例
2、各省好友数量
3、个性签名云图
第三方库
pyecharts
一个商业级图表,纯Js图表库。用于生成Echarts图表的类库。
jieba
中文分词组件。
scipy
工程设计的Python工具包。包括统计、优化、整合、线性代数模块、傅里叶变换、信号和图像处理、长积分方程求解器等等。
wordcloud
Python词云展示库,在一段文本中提取关键词进行扁平化的展示,更能吸引目标客户的眼球。
wxpy
微信个人API
re
Python的re模块提供了诸多正则表达式模块,使Python拥有了全部的正则表达式功能,库1方便检查一个字符串是否与某种模式匹配。
登录并查看相关信息
1、登录
bot = Bot() #扫描二维码自动登录
2、获取登录账号的所有好友
bot.friends()
3、获取当前登录账号所关注的公众号
bot.mps()
4、获取当前登录账号群聊列表
bot.groups()
5、搜索好友:
bot.friends().search(‘好友备注名’)[0]
6、搜索好友并发送消息
bot.friends().search(‘好友备注名’)[0].send(‘str’)
7、向文件传输助手发送信息
bot.fle_helper.send(‘str’)
字典
1、每个键值(key:value)对用冒号分隔
1 | >>>s = {'name':'udbs', 'age':20} |
访问字典
字典名[‘key’]
修改字典
字典名[‘key’] = ‘value’
删除字典
1、删除单一元素
格式:del 字典名[‘key’]
2、清空所有元素
格式:字典名.clear()
3、删除字典
格式:del 字典名
6月25日
读写文件
open函数,必须先用Python内置的open()函数打开文件,创建一个file对象。
1 | file object = open(file_name[, access_mode][, buffering]) |
with as语句
try-finally语句可以处理异常。但较麻烦。
python提供了with语句语法,来构建对资源创建与释放方法,但功能与try相似。with语句后面跟着open方法,如果有返回值,可以使用as语句赋值给变量,退出时自动调用close。
re模块
re.findall()方法
搜索整个字符串,返回匹配正则表达式的所有内容。
1 | re.findall(pattern,string) |
re.compile()方法
将正则字符串编译成正则表达式对象,以便后期匹配中复用。
1 | re.compile('正则表达式') |
正则表达式
- .匹配除了换行符之外的所有字符。
- d数字
- w字母
join()方法
用于将序列中的元素以指定的字符连接生成一个新的字符串
6月26日
jieba库
精确模式:jieba.lcut(str)
试图将语句最精确切分,不存在冗余数据,适合文本分析。
全模式:jieba.lcut(str,cut_all=True)
将与句中所有可能是词的词语都切分出来,速度快,但存在冗余数据
搜索引擎模式:jieba.lcut_for_search(str)
在精确模式的基础上·,对长词再次进行切分。
1 | >>> str = '手持两把锟斤拷' |
筛选函数isin()函数
isin()
功能:判断该列元素是否在某一个列表中。是True,否False。
groupby函数和agg函数
agg基于列的聚合操作
groupby基于行