Qiita Teams that are logged in
You are not logged in to any team

Log in to Qiita Team
Community
OrganizationAdvent CalendarQiitadon (β)
Service
Qiita JobsQiita ZineQiita Blog
Help us understand the problem. What is going on with this article?

大人気のGithub機械学習アイテムをご紹介 5選 - ScrapeStorm

この記事は五つの人気があるGitHub機械学習アイテムを紹介します。これらのアイテムは、自然言語処理(NLP)、コンピュータービジョン、ビッグデータなど、さまざまな機械学習の分野を含まれています。

1.PyTorch-Transformers

リンク:https://github.com/huggingface/pytorch-transformers
NLPはテキストの処理方式を変えて、その強さは言葉で説明できないほどです。
PyTorch-Tirans formersが最も遅く出現しましたが、各種NLPタスクに既にある基準を打ち破りました。PyTorchの実装などその他の需要な要素を含めて、初心者の入門を助けます。
下記の記事はPyTorch-Transformersを詳しく分析します。ご参照ください。
https://www.analyticsvidhya.com/blog/2019/07/pytorch-transformers-nlp-python/?utm_source=blog&utm_medium=7-innovative-machine-learning-github-projects-in-python
https://www.analyticsvidhya.com/blog/2019/03/pretrained-models-get-started-nlp/?utm_source=blog&utm_medium=7
-innovative-machine-learning-github-projects-in-python
https://www.analyticsvidhya.com/blog/2018/02/pytorch-tutorial/?utm_source=blog&utm_medium=7-innovative-machine-learning-github-projects-in-python

2. TDEngine

2.2.png
リンク:https://github.com/taosdata/TDengine
TDEngineデータベースは、ほぼ1か月足らずで10,000近くのStarを蓄積しています。
TDEngineは、オープンソースビッグデータプラットフォームです。下記の分野に注目しています。
・モノのインターネット(IoT)
・車両のインターネット
・ITインフラストラクチャなど。
現在、注意すべき点が1つあります。TDEngineはLinuxのみをサポートしています。データエンジニア向けのリソースガイドを読むことをお勧めします。
https://www.analyticsvidhya.com/blog/2018/11/data-engineer-comprehensive-list-resources-get-started/?utm_source=blog&utm_medium=7-innovative-machine-learning-github-projects-in-python

3.Video Object Removal

リンク:https://github.com/zllrunning/video-object-removal
コンピュータビジョンは画像を操作して処理するためのものであり、非常に先進的な技術です。コンピュータビジョンの専門家になるには、画像の目標検出が必須とされています。ビデオはどうですか? 複数のビデオでターゲットの境界ボックスを描画する場合、それは単純に見えますが、実際の難易度はそれよりはるかに高く、ターゲットの動的な性質によりタスクがより複雑になります。
したがって、Video Object Removalは優れています。ビデオ内のターゲットの周囲に境界ボックスを描画する限り、それを削除できます。
3.1.gif
下記の記事は素早く入門に役たちます。
https://courses.analyticsvidhya.com/courses/computer-vision-using-deep-learning-version2/?utm_source=blog&utm_medium=7-innovative-machine-learning-github-projects-in-python

4.Python Autocomplete

リンク:https://github.com/vpj/python_autocomplete
データ科学者の大部分の仕事は各種アルゴリズムを試験することです。Python AutocompleteはLSTMの簡単なモデルを使って自動的にPythonコードを書き上げることができます。
下記灰色の部分はLSTMモデルで自動的に生成されたコードです。
4.png
LSTMの詳細は下記の記事をご参照ください。
https://www.analyticsvidhya.com/blog/2017/12/fundamentals-of-deep-learning-introduction-to-lstm/?utm_source=blog&utm_medium=7-innovative-machine-learning-github-projects-in-python

5.MedicalNet

5.png
MedicalNetは、医療データセットをさまざまなモダリティ、ターゲット臓器、および病状と組み合わせて、より大きなデータセットを構築します。
ご存知のとおり、モデル学習モデルは大量のトレーニングデータが必要ですが、TenCentが発表したMedicalNetは素晴らしいオープンソースプロジェクトです。ぜひ試してみてください。
下記の記事をご参照になれば幸いです。
Https://www.analyticsvidhya.com/blog/2017/06/transfer-learning-the-art-of-fine-tuning-a-pre-trained-model/?utm_source=blog&utm_medium=7-innovative-machine-learning-github-projects-in-python

元記事:https://blog.csdn.net/qq_28168421/article/details/101088174?utm_medium=distribute.pc_feed_category.none-task-blog-new-11.nonecase&depth_1-utm_source=distribute.pc_feed_category.none-task-blog-new-11.nonecase&request_id=

ScrapeStorm-JP
ScrapeStormは、AIを使用した視覚的なWebスクレイピングツールです。プログラミングが必要なく、ほぼすべてのWebサイトからデータを抽出できます。強い機能を持って、使いやすいです。 URLを入力だけで、自動的に抽出するデータと次のページボタンを識別できます。複雑なルール設定が必要ないし、ただクリックしてスクレイピンができます。
Why not register and get more from Qiita?
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away