超好用，分享8个 Python 自动化脚本

每天你都可能会执行许多重复的任务，例如阅读新闻、发邮件、查看天气、打开书签、清理文件夹等等，使用自动化脚本，就无需手动一次又一次地完成这些任务，非常方便。而在某种程度上，Python 就是自动化的代名词。

今天分享 6 个非常有用的 Python 自动化脚本。喜欢记得收藏、关注、点赞。

注：文末提供技术交流群

1、自动化阅读网页新闻

这个脚本能够实现从网页中抓取文本，然后自动化语音朗读，当你想听新闻的时候，这是个不错的选择。

代码分为两大部分，第一通过爬虫抓取网页文本呢，第二通过阅读工具来朗读文本。

需要的第三方库：

Beautiful Soup – 经典的HTML/XML文本解析器，用来提取爬下来的网页信息

requests – 好用到逆天的HTTP工具，用来向网页发送请求获取数据

Pyttsx3 – 将文本转换为语音，并控制速率、频率和语音

import pyttsx3import requestsfrom bs4 import BeautifulSoupengine = pyttsx3.init('sapi5')voices = engine.getProperty('voices')newVoiceRate = 130 ## Reduce The Speech Rateengine.setProperty('rate',newVoiceRate)engine.setProperty('voice', voices[1].id)def speak(audio):engine.say(audio)engine.runAndWait()text = str(input("Paste article\n"))res = requests.get(text)soup = BeautifulSoup(res.text,'html.parser')articles = []for i in range(len(soup.select('.p'))):article = soup.select('.p')[i].getText().strip()articles.append(article)text = " ".join(articles)speak(text)# engine.save_to_file(text, 'test.mp3') ## If you want to save the speech as a audio fileengine.runAndWait()

2、自动化数据探索

数据探索是数据科学项目的第一步，你需要了解数据的基本信息才能进一步分析更深的价值。

一般我们会用pandas、matplotlib等工具来探索数据，但需要自己编写大量代码，如果想提高效率，Dtale是个不错的选择。

Dtale特点是用一行代码生成自动化分析报告，它结合了Flask后端和React前端，为我们提供了一种查看和分析Pandas数据结构的简便方法。

我们可以在Jupyter上实用Dtale。

需要的第三方库：

Dtale – 自动生成分析报告

### Importing Seaborn Library For Some Datasetsimport seaborn as sns### Printing Inbuilt Datasets of Seaborn Libraryprint(sns.get_dataset_names())### Loading Titanic Datasetdf=sns.load_dataset('titanic')### Importing The Libraryimport dtale#### Generating Quick Summarydtale.show(df)

3、自动发送多封邮件

这个脚本可以帮助我们批量定时发送邮件，邮件内容、附件也可以自定义调整，非常的实用。

相比较邮件客户端，Python脚本的优点在于可以智能、批量、高定制化地部署邮件服务。

需要的第三方库：

Email – 用于管理电子邮件消息

Smtlib – 向SMTP服务器发送电子邮件，它定义了一个 SMTP 客户端会话对象，该对象可将邮件发送到互联网上任何带有 SMTP 或 ESMTP 监听程序的计算机

Pandas – 用于数据分析清洗地工具

import smtplib from email.message import EmailMessageimport pandas as pddef send_email(remail, rsubject, rcontent):email = EmailMessage()## Creating a object for EmailMessageemail['from'] = 'The Pythoneer Here'## Person who is sendingemail['to'] = remail## Whom we are sendingemail['subject'] = rsubject ## Subject of emailemail.set_content(rcontent) ## content of emailwith smtplib.SMTP(host='smtp.gmail.com',port=587)as smtp: smtp.ehlo() ## server objectsmtp.starttls() ## used to send data between server and clientsmtp.login("deltadelta371@gmail.com","delta@371") ## login id and password of gmailsmtp.send_message(email)## Sending emailprint("email send to ",remail)## Printing success messageif __name__ == '__main__':df = pd.read_excel('list.xlsx')length = len(df)+1for index, item in df.iterrows():email = item[0]subject = item[1]content = item[2]send_email(email,subject,content)

4、将 PDF 转换为音频文件

脚本可以将 pdf 转换为音频文件，原理也很简单，首先用 PyPDF 提取 pdf 中的文本，然后用 Pyttsx3 将文本转语音。

import pyttsx3,PyPDF2 pdfreader = PyPDF2.PdfFileReader(open('story.pdf','rb')) speaker = pyttsx3.init() for page_num in range(pdfreader.numPages):text = pdfreader.getPage(page_num).extractText()## extracting text from the PDF cleaned_text = text.strip().replace('\n',' ')## Removes unnecessary spaces and break lines print(cleaned_text)## Print the text from PDF #speaker.say(cleaned_text)## Let The Speaker Speak The Text speaker.save_to_file(cleaned_text,'story.mp3')## Saving Text In a audio file 'story.mp3' speaker.runAndWait() speaker.stop()

5、从列表中播放随机音乐

这个脚本会从歌曲文件夹中随机选择一首歌进行播放，需要注意的是 os.startfile 仅支持 Windows 系统。

import random, os music_dir = 'G:\\new english songs' songs = os.listdir(music_dir) song = random.randint(0,len(songs)) print(songs[song])## Prints The Song Name os.startfile(os.path.join(music_dir, songs[0]))

6、智能天气信息

国家气象局网站提供获取天气预报的 API，直接返回 json 格式的天气数据。所以只需要从 json 里取出对应的字段就可以了。

下面是指定城市(县、区)天气的网址，直接打开网址，就会返回对应城市的天气数据。比如：

http://www.weather.com.cn/data/cityinfo/101021200.html 上海徐汇区对应的天气网址。

具体代码如下：

mport requests import json import logging as logdef get_weather_wind(url): r = requests.get(url) if r.status_code != 200: log.error("Can't get weather data!") info = json.loads(r.content.decode())# get wind data data = info['weatherinfo'] WD = data['WD'] WS = data['WS'] return "{}({})".format(WD, WS) def get_weather_city(url): # open url and get return data r = requests.get(url) if r.status_code != 200: log.error("Can't get weather data!")# convert string to json info = json.loads(r.content.decode())# get useful data data = info['weatherinfo'] city = data['city'] temp1 = data['temp1'] temp2 = data['temp2'] weather = data['weather'] return "{} {} {}~{}".format(city, weather, temp1, temp2) if __name__ == '__main__': msg = """**天气提醒**:{} {} {} {}来源: 国家气象局 """.format( get_weather_city('http://www.weather.com.cn/data/cityinfo/101021200.html'), get_weather_wind('http://www.weather.com.cn/data/sk/101021200.html'), get_weather_city('http://www.weather.com.cn/data/cityinfo/101020900.html'), get_weather_wind('http://www.weather.com.cn/data/sk/101020900.html') ) print(msg)

运行结果如下所示：

7、长网址变短网址

有时，那些大URL变得非常恼火，很难阅读和共享，此脚可以将长网址变为短网址。

import contextlib from urllib.parse import urlencode from urllib.request import urlopen import sysdef make_tiny(url):request_url = ('http://tinyurl.com/api-create.php" />+ urlencode({'url':url}))with contextlib.closing(urlopen(request_url)) as response: return response.read().decode('utf-8')def main():for tinyurl in map(make_tiny, sys.argv[1:]): print(tinyurl)if __name__ == '__main__':main()

这个脚本非常实用，比如说有内容平台是屏蔽公众号文章的，那么就可以把公众号文章的链接变为短链接，然后插入其中，就可以实现绕过

8、清理下载文件夹

世界上最混乱的事情之一是开发人员的下载文件夹，里面存放了很多杂乱无章的文件，此脚本将根据大小限制来清理您的下载文件夹，有限清理比较旧的文件：

import os import threading import time def get_file_list(file_path): #文件按最后修改时间排序 dir_list = os.listdir(file_path) if not dir_list: return else: dir_list = sorted(dir_list, key=lambda x: os.path.getmtime(os.path.join(file_path, x))) return dir_list def get_size(file_path): """[summary] Args: file_path ([type]): [目录]Returns: [type]: 返回目录大小，MB """ totalsize=0 for filename in os.listdir(file_path): totalsize=totalsize+os.path.getsize(os.path.join(file_path, filename)) #print(totalsize / 1024 / 1024) return totalsize / 1024 / 1024 def detect_file_size(file_path, size_Max, size_Del): """[summary] Args: file_path ([type]): [文件目录] size_Max ([type]): [文件夹最大大小] size_Del ([type]): [超过size_Max时要删除的大小] """ print(get_size(file_path)) if get_size(file_path) > size_Max: fileList = get_file_list(file_path) for i in range(len(fileList)): if get_size(file_path) > (size_Max - size_Del): print ("del :%d %s" % (i + 1, fileList[i])) #os.remove(file_path + fileList[i])

技术交流

欢迎转载、收藏、有所收获点赞支持一下！数据、代码可以找我获取

目前开通了技术交流群，群友已超过2000人，添加时最好的备注方式为：来源+兴趣方向，方便找到志同道合的朋友

方式①、发送如下图片至微信，长按识别，后台回复：加群；
方式②、添加微信号：dkl88191，备注：来自CSDN
方式③、微信搜索公众号：Python学习与数据挖掘，后台回复：加群

超好用，分享8个 Python 自动化脚本

1、自动化阅读网页新闻

2、自动化数据探索

3、自动发送多封邮件

4、将 PDF 转换为音频文件

5、从列表中播放随机音乐

6、智能天气信息

7、长网址变短网址

8、清理下载文件夹

推荐文章

技术交流

最新关注

热文推荐

COSCon’22 论坛集锦 1+16个论坛就等你了！

UESTC__ACM 1264 人民币的构造

5 使用默认参数的4大要点

O-MVLL:支持ARM64的基于LLVM的代码混淆模块

C语言编写图形界面

亚马逊云科技AI应用 SageMaker 新突破，机器学习优势显著

超好用，分享8个 Python 自动化脚本

1、自动化阅读网页新闻

2、自动化数据探索

3、自动发送多封邮件

4、将 PDF 转换为音频文件

5、从列表中播放随机音乐

6、智能天气信息

7、长网址变短网址

8、清理下载文件夹

推荐文章

技术交流

相关文章

最新关注

热文推荐