No description
Find a file
2026-06-25 09:56:42 +02:00
audio move: meiertobler.mp3 → audio/ 2026-06-25 09:49:15 +02:00
results move: meiertobler.mp3 → audio/ 2026-06-25 09:49:15 +02:00
.gitignore fix: .gitignore korrigiert (whisper cache, *.txt entfernt) 2026-06-25 09:44:34 +02:00
AGENT.md docs: README.md für Besucher + AGENT.md für interne Anweisungen 2026-06-25 09:40:59 +02:00
README.md docs: Lizenz-Hinweis nicht-kommerziell + aktualisierte Struktur 2026-06-25 09:56:42 +02:00
transkribieren_ch.py fix: offline-Modus — Modell lädt nur noch aus lokalem Cache (local_files_only) 2026-06-25 09:27:09 +02:00

Schweizerdeutsch-Transkription

Lokale Spracherkennung für Schweizerdeutsch auf Apple Silicon — vollständig offline, ohne Cloud-Service.

Modell

Detail Wert
Modell apexAI-Switzerland/whisper-large-v3-swissgerman
WER ~13.3 % (i4ds/srf-spc Testset)
CER ~6.66 %
Sprache Schweizerdeutsch → Standarddeutsch
Hardware macOS Apple Silicon (MPS-GPU, float16)
Lizenz Nur nicht-kommerzielle Nutzung (apexAI-Switzerland)

Nutzung

# Einzelne Datei
python transkribieren_ch.py audio.mp3 --modus transformers

# Ganzes Verzeichnis
python transkribieren_ch.py ./aufnahmen/ --modus transformers

# Schnellerer Modus (geringere Qualität)
python transkribieren_ch.py audio.mp3 --modus ctranslate2

Modi

Modus Backend WER RAM Geschwindigkeit
transformers PyTorch MPS ~13.3 % ~6 GB Langsam (beste Qualität)
ctranslate2 CTranslate2 ~37 % ~1.5 GB Schnell

Ausgabe

  • Transkripte werden als .txt neben der Audio-Datei gespeichert
  • Rohtext ohne Zeitstempel oder Metadaten
  • Schweizerdeutsch wird automatisch in Standarddeutsch transkribiert

Aufbau

transkription/
├── audio/                  # Audio-Dateien
│   └── meiertobler.mp3     # Test-Audio (106.8s)
├── results/                # Transkripte
│   ├── local_whisper-largev3-swiss.txt
│   └── ...
├── transkribieren_ch.py    # Transkriptionsskript
├── AGENT.md                # Interne Anweisungen
├── README.md
└── .gitignore

Lizenz

  • apexAI-Switzerland/whisper-large-v3-swissgerman: Nur nicht-kommerzielle Nutzung
  • Eigenes Projekt — keine externe Lizenz.