応用基礎としてのデータサイエンス AI×データ活用の実践 (データサイエンス入門シリーズ)
解答が公開されてますが
解説がないのと誤っている箇所もあるようなので解説付きで解きました
2 データエンジニアリング基礎
2.1 ビッグデータとデータエンジニアリング
- 2.1.1 ③
- ①Volume 大容量
- ②Variety 種類が多様
- 落ち運びは関係ない
- ④Velocity 発生や更新が高速
- 2.1.2 ①
- ②、③、④も一定のルールの下という制約はあるが原則正しい
- 2.1.3 ①
- ①は構造化データ
- 2.1.4 ②
- エッジコンピューティングを行うことで必ずしも高速な通信が必要とは限らない
- 2.1.5 ④
- ……もうちょっとマシな外れ選択肢にできないかな
2.2 データ表現、プログラミング基礎、アルゴリズム基礎
-
2.2.1 ③
- $2^8$
-
2.2.2 ①
- 2進法では0.1は下記のような循環小数となりこれを3倍しても0.3とはならないため
2進法 10進法 0.1 $1/2=0.5$ 0.01 $1/2^2=0.25$ 0.001 $1/2^3=0.125$ ... ... 0.000110011... 0.1 \begin{align} \end{align}
-
2.2.3 ⑤
a[0] a[1] a[2] 初期状態 901 992 718 b=aだが同じ実体 a[1]=997 901 992 718 b[0]=911だがaと同じ実体なのでa[0]に代入される 911 992 718 -
2.2.4 ②
-
2.2.5 ③
- ①紀元前のユークリッドの『原論』に記載あり
- ②$\mathrm{O}(n^2)$: バブルソート、$\mathrm{O}(n\operatorname{log}n): 2分木ソート、ヒープソート、マージソート$
- ④フローチャートなど
- ⑤Yes
2.3 データの収集と加工、データベース
- 2.3.1 ①
- ②検索
- ③クレンジング
- ④フィルタリング
- 2.3.2 ④
- ①友人の繋がりに偏ったデータとなる
- ②インターネット利用が多い人に偏ったデータとなる
- ③最寄りの駅に偏ったデータとなる
- ④通学に来ない人もいるので通学している人に偏ったデータとなる。大学の名簿からランダムサンプリングした方が望ましいと思うが、この選択肢の中ならばこれか
- 2.3.3 ③
- ①特徴の一つ
- ②体調の変化を疑った方が良い
- 2.3.4 ②
- ①テーブルのキーの連携でリレーションとなる
- ③検索条件を指定るする
- ④joinなどでできる
- 2.3.5 ②
- 履修者名簿、試験点数表は実体なので四角①X③X
- 試験は関係なのでひし形①X③X④X
- 名前は属性なのでだ円③X④X
2.4 ITセキュリティ
-
2.4.1 ③
- 1 xor 1 = 1, 0 xor 1 = 1 なので11
-
2.4.2 ④
- $3\cdot n=1 (\operatorname{mod} 7)$よりn=5
- 3*1=3
- 3*2=6
- 3*3=(9だが7で割ったあまりだから)2
- 3*4=(12だが7で割ったあまりだから)5
- 3*5=(15だが7で割ったあまりだから)1
- $3\cdot n=1 (\operatorname{mod} 7)$よりn=5
-
2.4.3 ④
\begin{align} (p, g, y)&=(23, 2, 8)\\ m&=3, r=2\\ u&=2^2(\operatorname{mod 23})\\ &=4\\ c&=8^2\cdot3(\operatorname{mod 23})\\ &=8\\ &\therefore (4, 8) \end{align}
-
2.4.4 ②
\begin{align} (p, g, x, l)&=(23, 2, 3, 11)\\ m&=2, r=2\\ u_1&=2^2 (\operatorname{mod}23)\\ &=4\\ u&=4(\operatorname{mod}11)\\ v&=2^{-1}(2+3\cdot 4) (\operatorname{mod}11)\\ ここで&2^{-1}=6(\operatorname{mod}11)\\ v&=18(\operatorname{mod}11)\\ &=7(\operatorname{mod}11)\\ &\therefore (4, 7) \end{align}
-
2.4.5 ②
\begin{align} \frac{60\times9+x}{10}&=63\\ x&=630-540\\ &=90 \end{align}