Projekt

Voice-paced Teleprompter

Python / FastAPI Web Speech API HTMX Vanilla JS TailwindCSS WebSockets

Problem

Klassische Teleprompter scrollen mit konstanter Geschwindigkeit. Spricht man schneller oder langsamer, passt der Text nicht mehr. Pausen, Versprecher oder Improvisation führen dazu, dass man den Faden verliert.

Lösung

  • Echtzeit-Spracherkennung über Web Speech API – kein lokales Modell, keine Latenz durch externe API
  • Fuzzy-Matching-Algorithmus (Levenshtein-Distanz) erkennt die aktuelle Position im Skript trotz Versprechern und abweichender Formulierungen
  • Geschwindigkeitsadaptiver Lookahead: SPM-Messung (Silben pro Minute) passt den Vorausblick dynamisch an (1–3 Wörter)
  • Sanftes Scrolling mit PID-ähnlichem Regler – kein ruckartiges Springen, proportionale Annäherung an die Zielposition
  • Beam-Feature: Skript per WebSocket auf beliebig viele Geräte spiegeln – ideal für Kamerasetups mit separatem Prompter-Display

Ergebnis

Nutzbares Produkt als Web-App – kein App-Store, keine Installation. Der Teleprompter folgt dem Sprechtempo in Echtzeit, keine manuelle Steuerung nötig. Spracherkennung läuft lokal im Browser, keine laufenden API-Kosten. Das Beam-Feature ermöglicht professionelle Multi-Device-Setups ohne zusätzliche Hardware.

Video wird nicht angezeigt? Auf YouTube ansehen

← Zurück zu Projekte

Ähnliches Problem?

Problem besprechen