Skip to content

Tom-atok/note_analysis

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

54 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

note_analysis

まだまだ準備中です

前準備

仮想環境の準備

参考:https://packaging.python.org/ja/latest/guides/installing-using-pip-and-virtual-environments/

仮想環境の作成

python3 -m venv .venv

仮想環境の活性化

source .venv/bin/activate

仮想環境でpythonを使用する

.venv/bin/python

仮想環境を終了する

deactivate

モジュールをインストールする

MeCabを使用する

そもそもPCにMeCabを入れる必要がある brew install mecab 辞書のインストール brew install mecab-ipadic

Neologdをインストール

ref: https://qiita.com/taroc/items/b9afd914432da08dafc8

brew install git curl xz
git clone --depth 1 [email protected]:neologd/mecab-ipadic-neologd.git
cd mecab-ipadic-neologd
./bin/install-mecab-ipadic-neologd -n

Neologdを指定するパスを見つけるには

echo `mecab-config --dicdir`"/mecab-ipadic-neologd"

デフォルトをNeolgdにする方法

ref: https://qiita.com/shimajiroxyz/items/e488e9b28a56e908e7cb 現在使用している辞書を確認する

mecab -D

mecabrcを探して書き換える

mecab-config --sysconfdir
#書き換え前
dicdir =  /usr/local/lib/mecab/dic/ipadic

#書き換え後
;dicdir =  /usr/local/lib/mecab/dic/ipadic
dicdir =  /usr/local/lib/mecab/dic/mecab-ipadic-neologd

requirements.txtから読み込む

仮想環境の活性化

source .venv/bin/activate
pip install -r requirments.txt

読み込めなかったら,requiements.txtを目で読んで,ひとつづつインストールしてね.

データの取得

fetch_articles.pyのmain関数を使う

query = "検索したい語"

# 自作したコードをimportする
from my_codes import fetch_articles

query_keys_all_df, selected_all_user_data = fetch_articles.main(
    query = query, size=100, batches=10000,interval=1
)
  • ユーザー10人ごとに中間結果を保存するようにしているので,checkpoint.csvの設定に従って,続きから取得を再開してくれる.

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published