カタバミさんのプログラミングノート

日曜プログラマーがプログラミング関係のメモを記録するブログです。

スクレイピング

Python 3でURLからHTMLを読み込んで要素一覧を取得する

Python 3でurllib.requestを使用してURLからHTMLを読み込み、Beautiful Soup 4とlxmlを使用して要素一覧を取得するサンプルコードです。読み込むURLはYahoo! JAPANのURLをお借りしています。 サンプルコード 参考 サンプルコード import urllib.request from…

PythonでとあるモデルサイトのHTMLを解析してCSVで出力してみる

言い訳 各種インストール 実際のコード 言い訳 例えばR界隈で有名だった(?)おっぱい方程式(おっぱい断面方程式、おっぱい曲面方程式)のように人はよく分からないことに全力を尽くしてしまうことがあります。これもその1つであって――すみません、XPath…