獲得点数 600/1000点
正答率: 60.0 % ( 24問 / 40問 正解 )
ランダムフォレストについて説明している以下の文章のうち、正しい選択肢を選べ
A,他の機械学習アルゴリズムと比較すると、欠損値の穴埋めや標準化などのデータの前処理を必要としないアルゴリズムである。
ランダムフォレストは複数の学習器を用いていることから、
アンサンブル学習や集団学習ともいわれています。
近接代入を使用して欠落しているデータの置換をすることで、
欠損値の推定分析結果の精度を安定させることができます。
また, 単体での分析と比較して、過学習を抑えることができる特徴を持っています。
Anacondaで特定のライブラリ(XXXX)のバージョンを更新する際に使用するコマンドとして正しいものを選べ
A,conda update XXXX
R言語について説明している以下の文章のうち、正しいものを選べ
A,RにはC++を使うためのパッケージが存在し、高速化をする際によく用いられる
enjoyという出力を返すように、XXXXに当てはまるものとして正しいものを選べ
import re
pattern = r"enjoy"
text = "enjoy data science"
matchOB = re.match(pattern , text)
if matchOB:
print(matchOB.XXXX)
A,group()
連続的な値を確率変数として考えることができる分布として正しいものを選べ
A,正規分布
以下のコードを実行した場合の出力として正しいものを選べ。
import numpy as np
A = np.array([[1,2,3],[4,5,6]])
B = A[0,:]
A[0,:]=0
B
A,array([0, 0, 0])
以下のコードを実行すると、変数A, B, C, Dには1つだけ異なるデータが格納される(4つのうち3つは同じデータが格納される)。格納されているデータが他の変数と異なる変数を選べ。
import numpy as np
A = np.full(10, 10.0)
B = np.array([10])*10 #array([100])
C = np.zeros(10)+10
D = np.ones(10)*10
A,B
以下のような日付、日経平均の株価の始値、終値が格納されたpandasデータフレームdfがある。このデータフレームのカラムの型を確認するためのメソッドとして正しいものを選べ
A,df.dtypes
以下のような、pandasデータフレームAとpandasデータフレームBがある。この2つのデータフレームの日付が一致する部分のみを列方向に結合したデータフレームを作成するコードとして正しいものを選べ
A,
pd.merge(A, B, how=”inner”, on=”日付”)
以下のような、ユーザーごとのサービス利用状況が格納されたデータフレームdfがある。
性別ごとの人数を棒グラフで表示するためのコードとして正しいものを選べ
A,
import matplotlib.pyplot as plt
df["性別"].value_counts().plot.bar()
plt.show()
以下のような、ユーザーごとのサービス利用状況が格納されたデータフレームdfがある。
性別ごとの利用回数のヒストグラムを別々に(※)描画するコードとして正しいものを選べ
※1つのグラフ内ではなく、男性のヒストグラム、女性のヒストグラムをそれぞれ別のグラフオブジェクトとして描画するという意味です
A,
df["利用回数"].hist(by=df["性別"])
plt.show()
サポートベクターマシンについて説明している以下の文章のうち正しいものを選べ
A,scikit-learnで使用する場合、カーネルはガウスカーネル以外にも指定することができる
scikit-learnで学習した決定木を可視化する際に使用するライブラリとして正しいものを以下の中から選べ
A,pydotplus