解壓電腦系統的軟件下載
準備工作:1、提前準備好pr2022軟件安裝包(*沒有的看文末*)2、系統必須是Windows 10 64bit3、保證電腦中有任意一款解壓軟件安裝步驟1.找到下載好的安裝包,并將其解壓到當前位置2....
2025.07.03COPYRIGHT ? 2023
粵ICP備2021108052號
郵箱:611661226@qq.com
留言給我如今網絡上很多小說網站都有免費的小說閱讀,但是它不提供下載全本的服務,目的也是為了獲得更多的流量,資源君就不服了,今天剛好看到一個小說網站,就想弄本小說來看看,于是拿起電腦,噼里啪啦寫了一個下載小說的Python代碼,下面我來帶大家讀一讀代碼(具體的代碼講解我已經寫在注釋里了)!
1.首先第一步,導入兩個我們需要的包
# 用于獲取網頁的htmlfrom urllib import request# 用于解析htmlfrom bs4 import BeautifulSoup
2. 我們來分析一下,我們要抓取的小說頁面
(廣告還挺顯眼的)
我們看下這個界面然后再來看看html源碼
我們會發現,我框住的地方正是我們所需要的地方,但是注意上面的最新章節和我們的正式的小說目錄也就是下面的地方,他們都處于
然后再來看看小說閱讀的界面:
這個界面就很簡單了,我們來看看HTML源碼:
很容易看到
標簽中的也就是正文
OK,經過我們初步分析,我們可以開始寫代碼了!
3.首先我們寫出獲取網頁html源碼的一個方法:
# 得到網頁的htmldef getHtml(url):url = urlres = request.urlopen(url)res = res.read().decode()# print(res)return res
這個方法傳入一個url,會返回一個html源碼
4.然后我們再來寫一下,獲取整本小說所有章節的鏈接的方法:
# 解析小說章節頁面,獲取所有章節的子鏈接def jsoupUrl(html):# 獲取soup對象url_xiaoshuo = BeautifulSoup(html)# 因為我們要拿取class為box1中的divclass_dict = {'class': 'box1'}url_xiaoshuo = url_xiaoshuo.find_all('div', attrs=class_dict)# 因為分析html中的代碼可以發現div的class為box1的有兩個,通過上面的代碼返回的是一個list格式的結果,所以下面的索引應該是1# 我們要獲取li中的值,所以find_all,這個方法返回的是一個list集合url_xiaoshuo = url_xiaoshuo[1].find_all('li')# print(url_xiaoshuo)# 創建一個集合,用于存放每個章節的鏈接url_xs = []for item in url_xiaoshuo:# 獲取每個元素中的href值url = item.a['href']# 將值傳入url_xs集合中url_xs.append(url)return url_xs
具體的解釋,我已經寫在注釋里了,不懂的可以在公眾號后臺留言
5.我們獲取到每個章節的鏈接之后,我們就需要把每一章節的內容給弄下來并且把它寫入到txt文本而且每個文本的標題為章節的標題
# 解析小說每個章節的的主要內容def jsoupXiaoshuo(list):for item in list:html = getHtml(item)html = BeautifulSoup(html)# 獲取小說標題title = html.h1.get_text()xiaoshuo = html.find_all('p')for item in xiaoshuo:str = item.get_text()# open中的第二個參數是讓每一次的字符串接連到上一個字符串,千萬不能是wwith open(title + '.txt', 'a') as f:f.write(str+'\n')
6.最后我們在main方法中運行這幾個方法即可:
if __name__ == '__main__':html = getHtml("http://www.136book.com/dadaozhaotian/")url_xs = jsoupUrl(html)jsoupXiaoshuo(url_xs)
大功告成!
不懂的可以在公眾號后臺留言,我全部都會回復的哦!
準備工作:1、提前準備好pr2022軟件安裝包(*沒有的看文末*)2、系統必須是Windows 10 64bit3、保證電腦中有任意一款解壓軟件安裝步驟1.找到下載好的安裝包,并將其解壓到當前位置2....
2025.07.03文件同步備份工具都有哪些?在你需要文件同步時你最先考慮的是選擇哪個軟件?今天小西給你推薦一款非常簡單實用的文件同步工具-FileYee。文件同步備份工具:FileYee同步備份模式:本地同步備份、百度...
2025.07.03Windows Server 2019是由微軟(Microsoft)官方推出的最新版服務器版操作系統,該系統基于Win Server 2016開發而來,后者是微軟迄今為止普及速度最快的服務器系統。Wi...
2025.07.03隨著微軟對win7系統的服務停止,各類硬件廠商也慢慢發布新品硬件適配win10系統的使用,比如華碩、技嘉、華擎、微星等大廠商,部分主板已經無法安裝win10系統,當然大多數新品主板也會兼容win7系統...
2025.07.02轉自堆糖網2.《開局就無敵, 我獲得智能領袖能量系統》 作者:麗聲 簡介【熱血+御姐+勵志+寫實+日常+獵奇+冒險+泡妞+咸魚翻身+絕處逢生+懸疑】 “咳咳咳……咳咳咳!同學……咳咳咳,同學們祝你們...
2025.07.02