昨夜のコードに前回のtext2speakを追加すると、念願の「ウワンさん、こんにちわ」ができました。
【参考】
①【Speak入門】text2speakとQRcode2speakを自作して遊んでみた♪
話は簡単なので、昨夜のコードの差分だけ説明します。
ストーリーは、顔識別したらその識別結果に「txt+さんこんにちわ」として、それをtext2speakに渡すということです。
###コード全体は以下に置きました
・face_recognition/recognize_vgg16_camera_ohayo.py
###コード解説
利用する追加Libは以下のとおりです。
import pyaudio
import wave
import time
import re
text2speak関数は丸々追加します。
def text2speak(num0):
...
text2speakの追加個所は以下のとおりです。
yomikomi関数で顔識別した結果をtxtに代入して、それをnum0=txt+"さんこんにちわ"として、このnum0を渡します。こうして「ウワンさんこんにちわ」と発話できます。
※ここでちょっとロジック入れれば「おはよう」とか「おつかれさま」とか発話出来ます
try:
roi = cv2.resize(roi, (int(224), 224))
cv2.imshow('roi',roi)
txt, preds=yomikomi(model,roi)
print("txt, preds",txt,preds*100 ," %")
txt2=conv.do(txt)
cv2.imwrite(path+"/"+label+"/"+str(sk)+'_'+str(txt2)+'_'+str(int(preds*100))+'.jpg', roi)
num0=txt+"さんこんにちわ"
print(num0)
text2speak(num0)
センテンスが短いので、はっきり綺麗に発話できました。
また、「まゆゆさんこんにちわ」「あかりんだーすーさんこんにちわ」と変化してくれました。
###まとめ
・「ウワンさんこんにちわ」などと識別結果に基づいて変化してくれました
・笑顔、悲しい顔、怒り顔、普通の顔などの情感変化に基づいた発話させたい
・もう少し複雑な会話形式のロジックと識別結果と連携して発話させたい