図解!Python BeautifulSoupの使い方を徹底解説!(select、find、find_all、インストール、スクレイピングなど)
こちらの動画で学習したことをメモしています。
セクション4 メモ
仮想環境で「conda install -c conda-forge newspaper3k」を「anaconda prompt」で実行しても以下のようにエラーが出た。
base環境で「conda install -c conda-forge newspaper3k」を「anaconda prompt」で実行するとエラーが表示されなくなった。
「jupyter notebook」を開く前に「anaconda prompt」で「anaconda activate 仮想環境名」を入力し、アクティブにしてから、「jupyter notebook」を開いている。
仮想環境でプログラムを動かしていたつもりだったがそうではなかったか?
api-ms-win-path-|1-1-0.d||がないため、プログラムを開始できません(未解決)
よくわからないので放置。
base環境で「juputer lab」を開くと上記のエラーは発生しませんが、仮想環境で「jupyter lab」を開こうと上記のエラーが発生して、開けない。
セクション4 エラーメッセージの解決方法
『ModuleNotFoundError:「tinysegmenter」』と表示されたので「tinysegmenter」は「conda install tinysegmenter」と「anaconda prompt」に入力して、インストールしたはずなのにと思っていました。原因は「jupyter notebook」を開く前に、「anaconda prompt」で自分の学習用の仮想環境に設定できていなかっただけでした。
ただ、学習用の仮想環境で以下のように実行しても、以下のように実行結果もエラーも表示されないようになりました。?????。
メモ:
諦めてセクション5に進んでみる。
セクション5
read_htmlを利用するには以下を実行して、ライブラリをインストールする必要がある。
conda install beatifulsoup4 lxml html5lib
ティッカーコード(識別コード):株式市場において上場企業の銘柄を分かりやすく識別するために用いられるアルファベットコードのことを指します。(こちらより)
セクション6
conda install requests
セクション7
conda install beautifulsoup4
セクション16
conda install c-conda-forge selenium
PythonによるWebスクレイピング〜入門編〜【業務効率化への第一歩】
こちらの動画で勉強したことをメモしています。
セクション2 環境構築
その他
jupter labとnotebookでpython以外の不要なファイルを表示させない方法【整理整頓】
以下のサイトを参考にするとうまくいくと思ってトライしましたが、パソコン初心者なのでうまくいきませんでした。
○Jupyter Lab の作業フォルダを変更
試行錯誤しているうちに、python用の作業フォルダーを以下のように自分で作り、pythonのファイルを入れました。
自分で作成した作業用フォルダーを毎回クリックする手間がありますが、しばらくこれで運用します。
「jupyter notebook」で開くと毎回作業フォルダをクリックしないといけませんが、「jupyter lab」で開くと前回の作業で表示していたフォルダが表示されるので、毎回作業フォルダをクリックする必要がなくなりました。
・・・こんな当たり前で誰にでも思い付くことをどうして記事に書いたのかは謎。
【ゼロから始めるデータ分析】 ビジネスケースで学ぶPythonデータサイエンス入門
○参照動画
セクション2 Matplotlibの日本語化
〇IPAexフォントおよびIPAフォントについて
ダウンロード→「C:\Anaconda3\Lib\site-packages\matplotlib\mpl-data\fonts\ttf」に解凍したファイルをコピーする。
「C:\Anaconda3\Lib\site-packages\matplotlib\mpl-data」にある「matplotlibrc」を開く。「#font.family: sans-serif」の下の行に「font.family: IPAexGothic」を追加する。
・・・でうまくいくはずだが、以下のようにうまくいかなかった。
原因:キャッシュファイルが残ってしまっている為、正常に読み込めていない可能性がある。
セクション2ー11より
解決策:キャッシュファイル(fontlist***.json)を削除する。
それでも、上の写真と同じようにエラーメッセージが出て、うまくいかなかった。
試行錯誤しているうちに原因が判明しました。
「%matplotlib inline」の後に「#任意のコメント」を入力するとなぜかエラーが発生していたようです。
「%」を使用した後は「#」を使用してはいけない決まりでもあるのかな。(解決に要した時間は1時間半)