Schweizerdeutsch-Transkription
Lokale Spracherkennung für Schweizerdeutsch auf Apple Silicon — vollständig offline, ohne Cloud-Service.
Modell
| Detail |
Wert |
| Modell |
apexAI-Switzerland/whisper-large-v3-swissgerman |
| WER |
~13.3 % (i4ds/srf-spc Testset) |
| CER |
~6.66 % |
| Sprache |
Schweizerdeutsch → Standarddeutsch |
| Hardware |
macOS Apple Silicon (MPS-GPU, float16) |
| Lizenz |
Nur nicht-kommerzielle Nutzung (apexAI-Switzerland) |
Nutzung
# Einzelne Datei
python transkribieren_ch.py audio.mp3 --modus transformers
# Ganzes Verzeichnis
python transkribieren_ch.py ./aufnahmen/ --modus transformers
# Schnellerer Modus (geringere Qualität)
python transkribieren_ch.py audio.mp3 --modus ctranslate2
Modi
| Modus |
Backend |
WER |
RAM |
Geschwindigkeit |
transformers |
PyTorch MPS |
~13.3 % |
~6 GB |
Langsam (beste Qualität) |
ctranslate2 |
CTranslate2 |
~37 % |
~1.5 GB |
Schnell |
Ausgabe
- Transkripte werden als
.txt neben der Audio-Datei gespeichert
- Rohtext ohne Zeitstempel oder Metadaten
- Schweizerdeutsch wird automatisch in Standarddeutsch transkribiert
Aufbau
transkription/
├── audio/ # Audio-Dateien
│ └── meiertobler.mp3 # Test-Audio (106.8s)
├── results/ # Transkripte
│ ├── local_whisper-largev3-swiss.txt
│ └── ...
├── transkribieren_ch.py # Transkriptionsskript
├── AGENT.md # Interne Anweisungen
├── README.md
└── .gitignore
Lizenz
- apexAI-Switzerland/whisper-large-v3-swissgerman: Nur nicht-kommerzielle Nutzung
- Eigenes Projekt — keine externe Lizenz.