gensimじゃなくてtomotopy使おうよ
tomotopyって? tomotopyは、TOpic MOdeling TOol の略で、主にLDA(Latent Dirichlet Allocation)とその派生のアルゴリズムを扱えるP...
7 search resultsShowing 1~7 results
You need to log-in
tomotopyって? tomotopyは、TOpic MOdeling TOol の略で、主にLDA(Latent Dirichlet Allocation)とその派生のアルゴリズムを扱えるP...
自己相互情報量PMI PMI(x, y) = log{\frac{P(x, y)}{P(x)P(y)}} これです。$P$ は確率分布です。 PMIは自然言語では、単語 $x, y$ の関連度合...
ガウス過程と機械学習 書籍「ガウス過程と機械学習」(持橋大地/大羽成征・著)の各章の公式などをまとめます。 途中式はかなり省略しているため、詳細は書籍を参照してください。 1章 線形回帰モデル ...
結論 リストのリストを作成するときは [[]] * n ではなく [[] for _ in range(n)] を使おう。 詳細 list_of_list = [[]] * 3 print(li...
Optunaとは ハイパーパラメータの自動最適化フレームワークです。 Pythonで利用できます。 Optunaには3つの特徴があります。 ① Define by RunスタイルのAPI ② 学...
はじめに コーディングをするときは、コメントをたくさん書け。 そう言われて育ちました。 しかし、この記事を見て、衝撃を受けました。 簡単に言うと、「できるだけコメントがなくてもわかりやすいコード...
概要 scikit-learnでk-meansを用いてクラスタリングしているときに思いました。 「距離関数をコサイン類似度にしたい」 scikit-learnのk-meansでは距離関数としてユ...
7 search resultsShowing 1~7 results
Qiita is a knowledge sharing service for engineers.