python爬取小说写入txt，Python奇遇记，指尖舞动，网页小说尽收囊中

欧气 2024年10月23日 19:10 0 0

本文目录导读：

环境准备
分析网页结构
编写Python代码
运行代码

在这个信息爆炸的时代，网络文学犹如一股清流，滋养着无数书迷的心灵，作为一名Python爱好者，我也有幸通过编程的方式，将心仪的网络小说一网打尽，存档于本地，随时翻阅，就让我为大家分享我的Python奇遇记，教大家如何轻松爬取网页小说，并将其保存到本地文件。

环境准备

1、安装Python：在电脑上安装Python，并确保其环境变量配置正确。

python爬取小说写入txt，Python奇遇记，指尖舞动，网页小说尽收囊中

图片来源于网络，如有侵权联系删除

2、安装第三方库：打开命令行窗口，输入以下命令安装所需的第三方库。

pip install requests
pip install beautifulsoup4
pip install lxml

分析网页结构

1、打开目标小说网站，找到一篇你喜欢的小说。

2、分析小说的网页结构，找出章节列表和章节内容所在的标签。

3、提取章节列表中的链接和章节名称。

编写Python代码

1、导入所需的库。

python爬取小说写入txt，Python奇遇记，指尖舞动，网页小说尽收囊中

图片来源于网络，如有侵权联系删除

import requests
from bs4 import BeautifulSoup

2、定义一个函数，用于获取章节内容。

def get_chapter_content(url):
    response = requests.get(url)
    soup = BeautifulSoup(response.text, 'lxml')
    content = soup.find('div', class_='content').text
    return content

3、定义一个函数，用于遍历章节列表，并保存章节内容到本地文件。

def save_chapters(chapter_urls):
    for i, url in enumerate(chapter_urls):
        content = get_chapter_content(url)
        with open(f'chapter_{i+1}.txt', 'w', encoding='utf-8') as f:
            f.write(content)
        print(f'已保存第{i+1}章：{url}')

4、主函数，获取章节列表并调用保存函数。

def main():
    url = '目标小说网站地址'
    response = requests.get(url)
    soup = BeautifulSoup(response.text, 'lxml')
    chapter_urls = []
    for link in soup.find_all('a', href=True):
        if link.text.strip() != '':
            chapter_urls.append(link['href'])
    save_chapters(chapter_urls)
if __name__ == '__main__':
    main()