tokenizeしたdata['train'][行数]['input_ids']に新たな行で['input_ids']を加える方法を知りたい。
解決したいこと 自然言語処理でストライドウィンドなるもので512を越えるトークンを分割し、区切ったトークンを新たなdataとして追加する方法を模索しています。data = DatasetDict...
2 search resultsShowing 1~2 results
解決したいこと 自然言語処理でストライドウィンドなるもので512を越えるトークンを分割し、区切ったトークンを新たなdataとして追加する方法を模索しています。data = DatasetDict...
解決したいこと type object 'Dataset' has no attribute 'from_dict' を直してDataset.from_dictを使いたい kaggleでnlpを...
2 search resultsShowing 1~2 results
Qiita is a knowledge sharing service for engineers.