주요 세팅 환경

python : 3.8.10

tensorflow : 2.5.0

deepspeech : 0.9.3

finetuning시 alphabet.txt파일의 한국어 버전을 정리하려고 시도

자모 분리, 한글자씩 분리, 단어별 분리 → 자모 분리(ㄱㄴㄷㄹ)와 한 글자씩(가,갸,개.계) 분리 시도

wav파일의 특징 추출에서의 선택

  1. MFCC 추출
  2. Mel Spectrogram 추출

코드 작성 중 tensorflow2.x버전에서 사용할 수 없는 메소드들 존재

→ tensorflow1.x버전의 메소드를 사용하기 위해서 import를 사용하여 호환성 접근을 하려 시도.

mp3파일을 → wav파일로 변환하는 과정에서 발생하는 에러

FileNotFoundError: [Errno 2] No such file or directory: 'ffprobe'

scorer를 deepspeech.Model(’scorer path’)하는 곳에서 발생하는 에러

RuntimeError: CreateModel failed with 'Error reading the proto buffer model file.' (0x3005)