当前位置:文档之家› 教你在python在工作中“偷懒”:Excel自动化处理 word关键信息提取 自动化运营监控 自动发送邮件

教你在python在工作中“偷懒”:Excel自动化处理 word关键信息提取 自动化运营监控 自动发送邮件

教你用python在工作中“偷懒”Excel自动化处理/word关键信息提取/自动化运营监控/自动发送邮件有些朋友在工作中会有这样的困惑:明明我从早忙到晚,为什么得到的评价还不高?要知道,企业对一个员工的评价是出于“产出”而非“付出”。

所以,如果把大量时间花在机械重复的工作上,不但工作效率不高,对个人发展来说也无甚帮助。

而这些工作,如果对于会点编程的人来说,往往通过几行代码就可以快速搞定了。

于是,我去了解了一下身边不同岗位(HR、产品、运营、市场、数据分析师等)每天需要面对的重复性劳动(肯定会有不全,欢迎补充~),总结了一些在工作中非常常见的例子,并且将源码整理好供参考。

希望这些程序可以让你的工作更高效!(升职加薪了别忘了回来发红包哦~)那么如何将这些统统实现呢?我将这些分为以下几类,大家可以自行评估,各取所需:如何用python在工作中“偷懒”?系统录入自动化由于你经常需要不断的将一些信息录入系统,每一次录入的过程中你可能需要不断的点击一些按钮,面对这种情况,完全可以写一个自动脚本,每次代替你来执行这些点击的行为。

这里我们需要用到splinter:pip install splinter这里写了一个自动登录邮箱的脚本,可以实现文本输入和网页点击:#coding=utf-8import timefrom splinter import Browserdef splinter(url): browser = Browser() #login 126 email websize browser.visit(url) #wait web element loading time.sleep(5) #fill in account and password browser.find_by_id('idInput').fill('xxxxxx')browser.find_by_id('pwdInput').fill('xxxxx') #click the button of login browser.find_by_id('loginBtn').click() time.sleep(8) #close the window of brower browser.quit()if __name__ == '__main__' splinter(websize)同理可以写一个简单的游戏挂机脚本,游戏挂机脚本,无非就是自动移动鼠标,自动点击,进行重复操作,所以,第一步就是如何控制鼠标。

import win32apiimport timedef move_click(x, y, t=0): # 移动鼠标并点击左键win32api.SetCursorPos((x, y)) # 设置鼠标位置(x, y) win32api.mouse_event(win32con.MOUSEEVENTF_LEFTDOWN | win32con.MOUSEEVENTF_LEFTUP, x, y, 0, 0) # 点击鼠标左键if t == 0: time.sleep(random.random()*2+1) # sleep一下else: time.sleep(t) return 0# 测试move_click(30, 30)def resolution(): # 获取屏幕分辨率return win32api.GetSystemMetrics(0), win32api.GetSystemMetrics(1)值得注意的是,一定要在管理员权限下的cmd中运行,否则点击无效。

这个时候,你已经可以写个循环,不停地点击屏幕上不同的几个点,最基础的挂机脚本就实现了。

Excel自动化处理Excel合并在实际应用中可能会有不同月份的数据或者不同周的报告等等的Excel 数据,都是单个独立的文件,如果想要整体使用的话就需要合并一下,那么如何利用python把指定目录下的所有Excel数据合并成一个文件呢?思路:利用python xlrd包读取excle文件,然后将文件内容存入一个列表中,再利用xlsxwriter将内容写入到一个新的excel文件中。

# -*- coding: utf-8 -*-#将多个Excel文件合并成一个import xlrdimport xlsxwriter#获取excel中所有的sheet表def getsheet(fh): return fh.sheets()#获取sheet表的行数def getnrows(fh,sheet): table=fh.sheets()[sheet] return table.nrows#读取文件内容并返回行内容def getFilect(file,shnum): fh=open_xls(file) table=fh.sheets()[shnum] num=table.nrows for row in range(num): rdata=table.row_values(row) datavalue.append(rdata) return datavalue或者直接用concat+一个循环来实现:for i in var_list: df_0 = data[['var_1','var_2','var_3','var_4',i]][data[i]=='信息'] df_0['month'] = date_replace(i) df_0 =df_0[['var_1','var_2','var_3','var_4','var_5']] li.append(df_0)writer = pd.ExcelWriter(r'C:\Users\mapping.xlsx')df = pd.concat(li)df.to_excel(writer,'Sheet1',index=False,header = None)dfExcel中添加数据图表整理好excel文件后下一步需要做的是处理文件里的数据,根据数据来生成一些自己需要的图表:import xlsxwriter#设置一个例子data = [20, 45, 26, 18, 45]#创建表格workbook = xlsxwriter.Workbook("temp.xlsx")worksheet = workbook.add_worksheet("data")#添加数据worksheet.write_column('A1', data)#创建图表chart = workbook.add_chart({'type': 'line'})#图表添加数据chart.add_series({ 'values': '=data!$A1:$A6', 'name': '图表名称', 'marker': { 'type': 'circle', 'size': 8, 'border': {'color': 'black'}, 'fill': {'color': 'red'} } , 'data_labels': {'values': True}, 'trendline': { 'type': 'polynomial', 'order': 2, 'name': '趋势线', 'forward': 0.5, 'backward': 0.5, 'display_equation':True, 'line': {'color': 'red', 'width':1, 'dash_type': 'long_dash'} }})worksheet.insert_chart('c1', chart)workbook.close() 实现效果:word关键信息提取假设你收到1万份简历,你想先根据学校做一些筛选,这时候利用python 将大量的简历进行信息汇总,只提取关键信息用excel查看起来更加方便。

docx文件自己本身是压缩文件,打开压缩包之后竟然发现里面有个专门存储word里面文本的文件。

那么步骤就变得简单了:1. 打开docx的压缩包2. 获取word里面的正文信息3. 利用正则表达式匹配出我们想要的信息4. 将信息存储到txt中(txt可以用excel打开)5. 批量调用上述过程,完成一万份简历的提取工作利用正则匹配获取关键信息:import redef get_field_value(text): value_list = [] m = re.findall(r"姓名(.*?)性别", table) value_list.append(m) m = re.findall(r"性别(.*?)学历", table) value_list.append(m) m = re.findall(r"民族(.*?)健康状况", table) value_list.append(m) ''' 此处省略其他字段匹配''' return value_list自动化运营监控在平时的工作中,一定会有对运营情况的监控,假设你管理一家店铺,那么一些关键指标肯定是你需要每天查看到的,比如店铺访问数,商品浏览数,下单数等等,这个时候不用每天重复地去统计这些数据,这需要写一个自动化程序,每天将数据保存在固定的文件夹下就可以实现报表的实时监控。

如果你的数据来源是线下文件:利用python操作线下文件将其载入数据库通过数据库对数据进行处理利用python输出结果from impala.dbapi import connectfrom impala.util import as_pandasimport datetimeconn =connect(host='host',port=21050,auth_mechanism='PLAIN',user='user',pa ssword='password')#host:数据库域名#user:数据库用户名#password:数据库密码df_data = pd.read_excel('temp.xlsx')rows =[]for index, row in df_data.iterrows():rows.append('('+'"'+str(row['case_id']).replace('nan','null')+'"'+','+'"'+str(row ['birth_date'])+'"'+')'+',') a= ''' INSERT into table (case_id, birth_date) values '''for i in rows: a += ia = a[:-1]cursor1 = conn.cursor()cursor1.execute(a)cursor1.close()conn.close()print('成功导入数据至数据库...')del adel rows如果你的数据来源是线上文件(存在数据库)直接利用python链接数据库进行一些列的操作导出你所需要的结果import sql #sql是封装的sql文件sql_end = sql.sql_endcursor1 = conn.cursor()for i in sql_end.split(';'): print(i) cursor1.execute(i)cursor1.close()conn.close()print('程序运行结束,请执行下一步。

相关主题