В статье 2006 года о временной классификации коннекционистов Алекс Грейвс и др. представила модель декодирования речи с 27 метками: 26 для букв алфавита и одна для пробела, что означает отсутствие метки (что я понимаю как молчание).
Тем не менее, я вижу много реализаций CTC, которые используют метки 28, одна из которых является пустой, а другая — пробелом. До сих пор я не смог найти объяснения необходимости использования обоих этих ярлыков, и для меня они означают одно и то же.
Не могли бы вы объяснить разницу между пробелом и пробелом в контексте CTC и зачем нужны обе эти метки?