✅ 対象アプリ名:サウンド レコーダー(Sound Recorder)
※旧「ボイス レコーダー(Voice Recorder)」と呼ばれていた場合もあり
🔧 手順:
-
スタートメニューで検索
→「サウンド レコーダー」と入力 → 起動 -
録音開始
🎤 マイクの準備ができたら、「●録音」ボタンをクリック -
録音終了
⏹️ 「■停止」ボタンをクリックすると、自動的に保存される
→ 保存先は通常:
C:\Users\[ユーザー名]\Documents\Sound recordings
-
再生・確認
アプリ内で再生でき、右クリックで「ファイルの場所を開く」も可能 -
出力形式
→ 通常は .m4a(AAC形式)で保存されます
🔄【m4a を mp4 / mp3 / wav に変換する方法】
✅ 方法①:無料ソフト「VLCメディアプレイヤー」で変換
🔧 手順:
- VLCをインストール(公式サイト)
- メニューから
メディア
→変換 / 保存
をクリック - ファイルタブで
.m4a
ファイルを追加 - 「変換」ボタン → 出力形式を
.mp3
,.mp4
,.wav
などから選択 - 出力先ファイル名と場所を設定 → 「開始」
✅ 方法②:オンライン変換サイトを使う(インストール不要)
🌐 おすすめサイト例:
✔️ 注意点:
- プライバシーや機密性の高い録音には不向き
- ネットにアップロードされる点に注意
✅ 方法③:Audacity(オープンソースの音声編集ソフト)
- Audacityをインストール(https://www.audacityteam.org/)
-
.m4a
をインポート(要 ffmpeg ライブラリ) - 「ファイル」→「書き出し」→
.mp3
/.wav
/.flac
など選択可能
📦 まとめ表
用途 | ツール | 特徴 |
---|---|---|
録音 | サウンドレコーダー | シンプル・Windows標準 |
m4a→mp3など変換 | VLC | オフライン可・高機能 |
m4a→mp3など変換 | Convertioなど | 手軽・ネット上で完結 |
音声編集&変換 | Audacity | カット・ノイズ除去も可能 |
🎙️ Google Colabで録音データを日本語で文字起こしする手順
✅ 準備するもの
- 録音ファイル(例:
recording.m4a
、myvoice.wav
など) - Googleアカウント(Colab使用のため)
- インターネット接続
🔧 Step-by-step(ステップ別)
🥇 Step 1:Google Colab を開く
- Google Colab にアクセス
- 新しいノートブックを作成
🥈 Step 2:必要なライブラリをインストール
# 音声認識ライブラリをインストール
!pip install SpeechRecognition pydub
# pydubの変換にffmpegが必要なのでインストール
!apt install ffmpeg
🥉 Step 3:録音ファイルをアップロード
from google.colab import files
uploaded = files.upload() # ここで m4a や wav をアップロード
アップロード完了後、例:recording.m4a
などのファイル名を確認してください。
🏅 Step 4:文字起こし処理(m4a → wav → 認識)
import speech_recognition as sr
from pydub import AudioSegment
# ファイル名を指定(例:recording.m4a)
input_file = "recording.m4a"
output_wav = "converted.wav"
# m4aをwavに変換
audio = AudioSegment.from_file(input_file, format="m4a")
audio.export(output_wav, format="wav")
# 音声認識(日本語)
recognizer = sr.Recognizer()
with sr.AudioFile(output_wav) as source:
audio_data = recognizer.record(source)
text = recognizer.recognize_google(audio_data, language="ja-JP")
print("🔊 認識結果:")
print(text)
📌 注意点
- Googleの音声認識API(無料枠)は短い音声(1分以内)に向いています。
- 長い録音は分割するか、Whisperなどのモデル使用をおすすめします。
🚀 もっと高精度な方法(オプション)
OpenAIの Whisperモデル を使うと、より高精度な日本語文字起こしが可能です。
!pip install git+https://github.com/openai/whisper.git
!sudo apt update && sudo apt install ffmpeg
import whisper
model = whisper.load_model("base") # small / medium も可
result = model.transcribe("converted.wav", language="ja")
print("📝 Whisper文字起こし結果:")
print(result["text"])
✅ 出力例(イメージ)
🔊 認識結果:
こんにちは、今日は天気が良いですね。今から買い物に行ってきます。