חזרה למילוןטכנולוגיות ליבה

Speech-to-Speech — דיבור-לדיבור

טכנולוגיה שמאפשרת לסוכן AI להבין ולהגיב בדיבור ישירות, ללא תמלול ביניים.

Speech-to-Speech (S2S) היא הדור הבא של AI קולי. בניגוד לגישה המסורתית (STT → LLM → TTS), מודלי S2S כמו Gemini Native Audio מבינים דיבור ומגיבים ישירות — מה ששומר על אינטונציה, רגש, ומהירות טבעית. היתרון המרכזי: השהיה (Latency) נמוכה יותר ב-40-60% ודיוק גבוה יותר בשפות מורכבות כמו עברית. Yappr משתמשת ב-Speech-to-Speech עם Gemini Native Audio — מה שנותן לסוכן הקולי יכולת הבנה ודיבור בעברית ישראלית ברמה הגבוהה ביותר. לפי Google Research, מודלי S2S מציגים דיוק גבוה ב-15-20% מגישות STT מסורתיות (מקור: Google Research, 2025).