JavaでDynamoDB JSONを生成する
(編集履歴を削除したかったので再投稿しました。) 目的 AWSのDynamoDBにデータをインポートする際のDynamoDB JSON形式をJavaで生成する方法を記載します。 なお、Dynam...
10 search resultsShowing 1~10 results
You need to log-in
(編集履歴を削除したかったので再投稿しました。) 目的 AWSのDynamoDBにデータをインポートする際のDynamoDB JSON形式をJavaで生成する方法を記載します。 なお、Dynam...
動機 (時)系列処理とかでしばしば利用するSliding Window処理をJavaでやりたい。 SQLだと標準で(大半の実装で?)Window関数があるので悩まなくていいのですが、Javaでは...
Wikipediaデータを用いてコンテンツ(アニメ・漫画・映画・ゲーム・小説)のデータ分析やデータ整理を行っています。本記事では、カテゴリ情報を用いて、コンテンツの特徴を算出することを試みます。...
編集距離のList版。 Java17で簡単な動作確認しましたが、Java8でも動くと思います。 動機 集合(Set)での類似度(Jaccard係数、Dice係数、Simpson係数、など)のよう...
はじめに 本記事は、ハイパーグラフの考え方をSQLで実現し・操作することを目的に記載しています。まずは、簡単な検索ができるところまで記載します。 ハイパーグラフについての情報は、Google検索...
グラフDBであるneo4jを操作するCypherについて勉強中。 公式の解説では「SQLライク」と売り文句が記載されている。個人的には、これが逆に理解の妨げになった。 SQLならわかるぜー、の気...
はじめに 辞書不要の「文字種を用いての分かち書き」の考察・評価メモ。 IT関係文章(カタカナ、英字が多い)と、法律関係文章(漢字多い)で実験する。 本書の結論は「汎用的な実装は難しいが、ドメイン...
はじめに 法律文書を集めようとすると、初めに考えうるのはeGovの条文と思われる。 条文データはXMLで公開されており、構造化されているためである。 他方、例えば裁判所の判例データは、PDFで公...
法律文書において共起される単語ペアを列挙する。 前記事までn-gramで頑張っていたけれど本記事ではおとなしくMeCab利用。 参考 以下を参考にさせて頂いた。ただし、元記事ではグラフまでやって...
Counterクラスを用いた出現数のカウント 頻出のトークンを抽出するために、Counterクラスの勉強をしています。 import collections import more_iterto...
10 search resultsShowing 1~10 results
Qiita is a knowledge sharing service for engineers.