Juliaって
Juliaの初心者向けの勉強会に参加してきました。
Pythonも始めたものの少しも身についていないのですが、それならいっそJuliaでもやるか!っとことで、勉強会のお題のBubbleSortでのJuliaとPython3の速度比較をやってみました。
実行環境
実行マシン
OptiPlex 9010
メモリ: 16 GB
プロセッサ: Intel(R) Core(TM) i5-3570 CPU @ 3.40GHz[Cores 4] [Logical/Core 1]
NVIDIA GeForce GTX 1650
OS・Python/Julia
Windows10上にWSL2 + Ubuntu-20.04 を入れて、VSCodeのコンソールから動かしました。
C:\Users\nandy>ver
Microsoft Windows [Version 10.0.19041.388]
C:\Users\nandy>wsl -l
Linux 用 Windows サブシステム ディストリビューション:
Ubuntu-20.04 (既定)
nandymak@Moon:/mnt/c/Users/nandy$ julia -v
julia version 1.4.1
nandymak@Moon:/mnt/c/Users/nandy$ python3 -V
Python 3.8.2
VisualSourceCode の設定
特に何もしていませんが、以下の拡張機能が入っています。
- Japanese Language Pack for Visual Studio Code (v1.48.1)
- Remote - WSL (v0.44.4)
- Julia (v1.0.0)
- Python (v2020.7.96456)
Remote - WSLによってWSL側にVSCodeから接続すると、その他の拡張機能がコピーされるようです。
実行したソース
サンプルで頂いたソースを比較用に少し弄っただけで特にチューニングや、細かい差異をなくすようなことはしていません。
あくまでざっくり比較するためのコードになっています。
Julia
#/usr/bin/julia
function BubbleSort(array)
for i = 1:length(array)-1,j = length(array):-1:i+1
if array[j-1] > array[j]
temp = array[j]
array[j] = array[j-1]
array[j-1] = temp
end
end
return array
end
array = rand(1:1000,30000)
println(length(array))
@time BubbleSort(array)
Python
#/usr/bin/python3
import numpy as np
import time
def BubbleSort(array):
for i in range(len(array)):
for j in range(len(array)-1, i, -1):
if array[j-1] > array[j]:
temp = array[j]
array[j] = array[j-1]
array[j-1] = temp
return array
array = np.random.choice(np.arange(1,1000),30000)
start = time.time()
print(len(array))
BubbleSort(array)
elapsed_time = time.time() - start
print("elapsed_time:{0}".format(elapsed_time) + "[sec]")
実行結果の比較
比較は、1~1000の乱数を10,000個、30,000個、100,000個の配列にして、それぞれバブルソートする時間を計測しました。
nandymak@Moon:~$ julia Bubblesort-Julia.jl
10000
0.180810 seconds (68.70 k allocations: 3.666 MiB)
nandymak@Moon:~$ julia Bubblesort-Julia.jl
30000
1.362512 seconds (68.70 k allocations: 3.666 MiB)
nandymak@Moon:~$ julia Bubblesort-Julia.jl
100000
13.110268 seconds (68.70 k allocations: 3.666 MiB)
nandymak@Moon:~$ python3 Bubblesort-Python.py
10000
elapsed_time:26.179977416992188[sec]
nandymak@Moon:~$ python3 Bubblesort-Python.py
30000
elapsed_time:272.1281180381775[sec]
nandymak@Moon:~$ python3 Bubblesort-Python.py
100000
elapsed_time:2905.497967004776[sec]
nandymak@Moon:~$
整理すると
個数 | julia | python | 比較 |
---|---|---|---|
10,000 | 0.180810 | 26.179977 | 144.79 |
30,000 | 1.362512 | 272.128118 | 199.73 |
100,000 | 13.110268 | 2905.497967 | 221.62 |
結論
やっぱり速かった。
色々なケースがあるでしょうが、数行の処理のコードで100倍以上の差があり、処理量が多くなると差が広がっていくので、機械学習などでPythonで書く部分が多ければ、Juliaを使って試行錯誤する方がよいケースもあると思われます。
機械学習のライブラリ等の使い勝手が同じかはこれから調べるところですが、同じ覚えるならJuliaもありかと思います。
おまけ
VisualSourceCode に拡張機能:Julia Language Supportを入れることで、VSCodeのコンソールにREPLが動きます。
Juliaのコードをエディタで書いて、Shift+Enterでソースコードを実行してくれたり、ターミナル部分でコードを対話的に実行できます。