藍噹科技: python 3 抓取網頁(解決編碼問題) (獨家)

2018年6月1日星期五

python 3 抓取網頁(解決編碼問題) (獨家)

python 3 抓取網頁原始碼(解決編碼問題)

看了網路上的一堆資料，已經乏味，解決方式眾說紛紜，沒有一個是正確的辦法。

以下都是小編實際測試過的

有些人說 encode()有效
實測: 失效

有些人說 decode()有效
實測: 失效

有些人說 utf-8 有效
實測: 失效

有些人說 unicode有效
實測: 失效

有些人說使用chardet
實測: 失效 (不僅失效，還把小編的預設編碼搞亂)

有些人說要get_content參數
實測: 失效

漫長的解決道路上，沒有一個是完全有效的做法

後來小編找了一個字串處理
就變成萬用解法

拿Google官網原始碼來示範

這是失效的狀態

==============================================================

拿Google官網原始碼來示範

這是小編親自測試成功的狀態

By 藍雪科技-Sibe

有著作權，請勿轉載。若要分享，請註明本篇來源。

藍噹科技

2018年6月1日星期五

python 3 抓取網頁(解決編碼問題) (獨家)

沒有留言:

張貼留言

Ollydbg 2.01 繁體中文版

追蹤者

總網頁瀏覽量

2018年6月1日 星期五

python 3 抓取網頁(解決編碼問題) (獨家)

沒有留言:

張貼留言

Ollydbg 2.01 繁體中文版

2018年6月1日星期五