クイックスタートの通りに実行しても動かなかったのでメモ。
$ mkdir $HOME/reasonspeech
$ cd $HOME/reasonspeech
$ python3 -m venv .venv
$ source .venv/bin/activate
ModuleNotFoundError: No module named 'Cython'
エラーが出るため、以下を実行する。
参考: https://qiita.com/wulong777/items/eb44d4471c0dee69cef6
$ pip install --upgrade pip setuptools wheel
$ pip install Cython
$ git clone https://github.com/reazon-research/ReazonSpeech
$ pip install ReazonSpeech/pkg/nemo-asr "huggingface-hub==0.23.0" "numpy<2.0.0"
huggingface-hub
は0.23.0
以下でないと動かないようだ。
参考: https://github.com/NVIDIA/NeMo/issues/9793
from huggingface_hub import HfApi, HfFolder, ModelFilter, hf_hub_download
ImportError: cannot import name 'ModelFilter' from 'huggingface_hub' (/Users/[省略]/.venv/lib/python3.11/site-packages/huggingface_hub/__init__.py)
numpy
も2.0.0
以下である必要がある。
File "/usr/local/reazonspeech/.venv/lib/python3.10/site-packages/nemo/collections/asr/parts/preprocessing/segment.py", line 168, in _convert_samples_to_float32
if samples.dtype in np.sctypes['int']:
File "/usr/local/reazonspeech/.venv/lib/python3.10/site-packages/numpy/__init__.py", line 397, in __getattr__
raise AttributeError(
AttributeError: `np.sctypes` was removed in the NumPy 2.0 release. Access dtypes explicitly instead.. Did you mean: 'dtypes'?
実行は親ディレクトリに移動する必要がある。
$ pwd
/User/user_name/reazonspeech
$ reazonspeech-nemo-asr samole.wav
ちなみにreazonspeech-nemo-asr
の実体は$HOME/reazonspeech/.venv/bin/reazonspeech-nemo-asr
にある。