Listed in the following categories:
Whisper
3.8 (2 reviews)
Are you the provider of this software?
Alternatives to Whisper
Item 1 of 8
This is how users rate the product
7.9
Ease of use
Voice Recognition
Average: 8.8
7.9
Meets requirements
Voice Recognition
Average: 8.3
0
Customer Support
Voice Recognition
Average: 8.5
8.6
Ease of setup
Voice Recognition
Average: 9
Item 1 of 3
Free trial version
Whisper Reviews (2)
“Ein solides STT Modell”
Source of review
4.0
M
Older than 12 months
Marius
Validated Reviewer
Data Scientist
at
Atruvia
- 1001+ employees
- Industry: Banking
What did you like?
Whisper ist ein super Modell, was eben Open-Source verfügbar ist und gefinetuned werden kann. Es gehört zu den Top-Modellen in der STT-Welt und kann gut verwendet werden um verschiedene Aufgaben im ML-Bereich zu lösen, Transkription, Übersetzung etc.
What did you not like?
Natürlich ist es in der englischen Sprache am stärksten, es wäre super wenn auch andere Sprache annähernd so stark wären, aber das liegt leider an der Verfügbarkeit der Daten. Zudem ist Whisper ein End-to-End Modell, sprich es ist quasi eine Blackbox und man kann leider auch Teilschritte nich so einfach ausstellen. Zum Beispiel setzt das Modell automatisch Satzzeichen und macht Groß- und Kleinschreibung. Nicht in jedem Use-Case ist das sinnvoll.
Which problems are you solving with the product?
Spracherkennung, Übersetzung von Texten. Das Modell wurde auf einem riesigen Datensatz trainiert, was schwer zu kopieren ist, daher ist es in mehreren Sprachen stark und aktuell eines der besten Modelle. Modelle in der Größe können nur von wenigen Unternehmen trainiert werden, daher ist es gut dass es Open-Source auch verfügbar ist.
“Whisper liefert gute Transkriptionen, aber ist nicht das schnellste Modell”
3.5
M
In the last 6 months
Marius
Validated Reviewer
Data Scientist
at
Atruvia
- 51-1000 employees
- Industry: Banking
What did you like?
Whisper von OpenAI liefert wirklich gute Transkriptionen und ist auch Multilingual, sprich verfügbar in einer Vielzahl von Sprachen. Es kann auch Interpunktion und Groß und Kleinschreibung relativ gut und gehört mit zu den besten ASR Modellen unserer Zeit.
What did you not like?
Es ist ein sehr großes Modell und daher ist es für die Einbindung in Streaming und Realtime Transkriptionen etwas langsam. Durch die Vielzahl an Parameter und vor allem durch die multilinguale Ausrichtung ist es sehr groß, was die Performance beeinträchtigt. Auch beim Pricing sollte man seine Use Cases genau durchrechnen.
Which problems are you solving with the product?
Transkriptionen, Übersetzungen, Interpunktion und Groß-und Kleinschreibung. Erkennung von Sprache und Umwandlung in Text.