概要
kaggleについて Spaceship Titanicの概要説明を行うものです。
このコンペティションは無期限に実施され、ローリングリーダーボード形式で進行します。詳しくはこちらをご覧ください。
説明
📣 おすすめのコンペティション
初心者向けに「Titanic - Machine Learning from Disaster」をお勧めします。このコンペティションで、機械学習やKaggleの基礎を学びましょう。
西暦2912年、データサイエンスのスキルが求められる宇宙の謎を解明する時が来ました。4光年先からの通信を受信しましたが、事態は深刻です。
スペースシップ・タイタニックは1か月前に打ち上げられた星間旅客船で、約13,000人の乗客を乗せて太陽系から近隣の3つの居住可能な惑星へ移住する計画でした。しかし、最初の目的地である55 Cancri Eへの航行中、アルファ・ケンタウリ付近で宇宙船は塵の中に隠された時空の異常に衝突しました。その結果、タイタニック号の運命と同じように、乗客の半分が異次元に送り込まれてしまいました。
救助隊が乗客を救出し、異次元に送り込まれた人々を見つけ出すために、あなたは宇宙船の損傷したコンピュータシステムから回収されたデータを基に、どの乗客が異次元に転送されたかを予測するという課題に挑みます。
彼らを救い、歴史を変える手助けをしましょう!
💡 スタートガイドノートブック
迅速に始めたい方は、スターターノートブックをご活用ください。
他のユーザーとコンペティションについて話し合いたい場合は、Discordに参加してください。コンペティション、求人情報、キャリアの話題、リソースなどについて話し合うためのチャンネルがあります。参加はこちらから: https://discord.gg/kaggle
評価
評価基準
提出物は分類精度(予測ラベルの正解率)に基づいて評価されます。
提出形式
このコンペティションの提出形式は、以下のようなCSVファイルです:
コードをコピーする
PassengerId,Transported
0013_01,False
0018_01,False
0019_01,False
0021_01,False
etc.
よくある質問
Getting Startedコンペティションとは?
初心者向けのコンペティションで、機械学習やKaggleに慣れるために作られました。機械学習の基礎を学びたい人や、MOOCを終えてKaggleに参加したい人に最適です。賞金はなく、ローリング形式で開催されます。
チームの作成と管理方法
コンペティション規約に同意すると、チームが自動的に作成されます。他のメンバーをチームに招待したり、チームの合併を承認したり、チーム名などの基本情報を更新できます。チームを作ることで、新しいスキルを学びながら楽しむことができます。
ノートブックとは?
Kaggle Notebooksは、再現可能で協力的な分析を可能にするクラウドベースの計算環境です。Python、R、Jupyter Notebooks、RMarkdownのスクリプトをサポートしており、Spaceship Titanicコンペティションで公開されたコードをすべて閲覧することができます。
チームがリーダーボードから消えた理由は?
2か月間提出がない場合、提出物は無効となりリーダーボードから削除されます。これにより、リーダーボードが整理され、新規参加者が埋もれないようにします。
引用
Addison Howard, Ashley Chow, Ryan Holbrook. (2022). Spaceship Titanic. Kaggle. https://kaggle.com/competitions/spaceship-titanic
データセットの説明
このコンペティションでは、Spaceship Titanicが時空の異常に衝突した際に、乗客が別の次元に転送されたかどうかを予測することが課題です。予測を行うために、宇宙船の損傷したコンピュータシステムから回収された個人記録が提供されています。
ファイルおよびデータフィールドの説明
1. train.csv
約2/3の乗客(約8700人)の個人記録が含まれており、これがトレーニングデータとして使用されます。
PassengerId: 各乗客に固有のID。このIDは「gggg_pp」の形式を取り、ggggはグループを示し、ppはそのグループ内での番号を示します。グループ内の人々は家族であることが多いですが、必ずしもそうではありません。
HomePlanet: 乗客が出発した惑星。通常はその人の居住惑星です。
CryoSleep: 乗客が航海中に冷凍睡眠を選んだかどうかを示します。冷凍睡眠中の乗客はキャビンに留まっています。
Cabin: 乗客が滞在しているキャビン番号。形式は「デッキ/番号/サイド」で、サイドは「P」(Port: 左舷)か「S」(Starboard: 右舷)になります。
Destination: 乗客が降りる予定の惑星。
Age: 乗客の年齢。
VIP: 乗客がVIPサービスを受けているかどうか。
RoomService, FoodCourt, ShoppingMall, Spa, VRDeck: Spaceship Titanicの豪華施設での利用料金(ルームサービス、フードコート、ショッピングモール、スパ、VRデッキ)。
Name: 乗客の名前(名字と名前)。
Transported: 乗客が別の次元に転送されたかどうか(予測すべきターゲット列)。
2. test.csv
残りの約1/3の乗客(約4300人)の個人記録が含まれており、これはテストデータとして使用されます。このセットの乗客に対して、Transportedの値(TrueまたはFalse)を予測することが求められます。
3. sample_submission.csv
正しいフォーマットのサンプル提出ファイルです。
PassengerId: テストセットにおける各乗客のID。
Transported: 各乗客について、True(転送された)またはFalse(転送されなかった)を予測します。
この情報を基に、異次元へ転送されたかどうかを予測するためのモデルを構築します。