עומר, זיהוי קול -> טקסט בגדול היום בשוק נחלק לשתי קטגוריות. זה שמאומן
לקול/מבטא שם אדם אחד ואז מאפשר הכתבה בקצב סביר (מוצרים קנייניים כגון Dragon
Dictate עולים בזכרוני), ולעומתם אלגוריתמים שונים למדי שמטפלים בפקודות
קוליות קצרות יחסית ומוטעמות בקצב דיבור יותר איטי, כמו סירי, קורטנה, גוגל
נאו וכדומה. שני התחומים מתקרבים, אבל משניהם לא תבוא לך בשורה. ברגע שיש
מוזיקת רקע, אנשים שמדברים ביחד ובווליומים שונים (כמו השיחה הקולחת ברברס עם
פלטפורמה), לא פעם דרך קו טלפון משובש או מיקרופונים גרועים, אתה מגיע להקלטה
שקשה לפעמים לאדם שומע אפילו לעקוב אחריה. אני למשל שומע בעיקר בזמן הנהיגה,
ובלי אוזניות אני לא מצליח לעקוב אחרי הדיאלוג שם, אז לצערי זה פודקאסט מקצועי
וטוב שאני נאלצתי לוותר עליו, כי רמת האודיו לא מאפשרת לשמוע אותו בתנאים האלו.

פודקאסטים שכן מתומללים, תמיד מתומללים ידנית, ונתקלתי רק בקומץ שלהם. למשל
SGU שמתומלל ע"י המעריצים, או "עושים הסטוריה" של רן לוי שמפרסם את חלק
מהתסריטים שלו כמאמרים בספרים הנמכרים לחוד. אבל אלו יוצאי הדופן, לא הכלל,
לצערי.

עירא.

2016-06-21 15:45 GMT+03:00 Omer Zak <w...@zak.co.il>:

> On Tue, 2016-06-21 at 09:59 +0300, Shachar Shemesh wrote:
>  <כל שיוכי לפודקאסט המדובר הוא בזה שהשתתפתי באחד.
> >
>  <On 16/06/2016 00:07, Omer Zak wrote:
> >
>  < <נחלק את הבעיה לשני חלקים:
> > >
>  < <1. פודקאסטים היסטוריים: צריך פלטפורמה שתאפשר לאנשים לעשות תמלול-המונים
> > > (crowd transcription) - כל אחד יתמלל קטע של כמה שניות עד שכל הפודקאסט
>  < <מתומלל.
>  < <האם מישהו מכיר או מעוניין לפתח פלטפורמה כזו?
> > >
> > >
>  <עומר,
> >
>  <אם אתה, שמרגיש את הצורך, לא מוכן להשקיע את הזמן שלך בלפתח פלטפורמה כזו,
> מה גורם לך לחשוב שמישהו אחר ירצה?
>
> זו תגובה מאוד לא מועילה.
> המקרה של אדם עם מוגבלות שמפתח בעצמו את אביזרי העזר עבור עצמו זה היוצא מן
> הכלל, לא הכלל.
>
> ובמקרה שלי, קיימים אילוצים של פרנסה, זמן ומימון. צריך מימון במיוחד בשביל
> שיהיה אפשר לשכור מפתח שומע, שיכול לשלוט באיכות הקול שאותו ישמעו המתנדבים
> שיתמללו קטעים.
>
> תגובה יותר מועילה תהיה לחפש רעיונות איך להשתמש בפלטפורמה גם למטרות אחרות
> (שימוש רב-תכליתי). זה בעצם מה שעשיתי כאשר הצעתי במכתבי המקורי:
>
> > ב. חיפוש לפי תוכן.
> > ג. קריאה מהירה ברפרוף למי שמחפש מידע ספציפי.
>
> ככל שיהיו יותר רעיונות לשימושים נוספים, יהיה יותר קל לגייס משאבים לקידום
> הפרויקט.
>
>  < <כמו כן אפשר אולי להשתמש בתוכנות להמרת דיבור לטקסט (ואחר כך תיקון ידני
> של
>  < <טעויות בהמרה) אם אתם מקליטים את הפודקאסט בתנאים אידיאליים (ללא רעשי
>  < <סביבה וביטוי ברור של המילים השונות).
> > >
>  <אתה מומחה הנגישות.
>
> אני צרכן נגישות והתנדבתי להיות רכז נגישות. זה לא הופך אותי אוטומטית
> למומחה לנגישות.
>
>  < איזו תוכנה עובדת טוב בעברית?
>
> לפני כ-4 שנים השקעתי כמה חודשים וכ-20K ש"ח כדי להגיע למסקנה ה(לא)מפתיעה,
> שלא היתה
> קיימת אז תוכנת זיהוי דיבור עברי טובה ללא תלות בדובר.
> מאז לא עקבתי אחר ההתפתחות הטכנולוגית בתחום זה.
>
>  < מה קרה כשהרצת אותה על פודקאסטים קיימים?
>
> לא על פודקאסטים קיימים אבל על קטעי קול אחרים ב-2012, התוצאות היו
> קטסטרופליות.
>
> כאן המקום לציין שנושא תמלול המונים עלה לפני כמעט 10 שנים, כאשר תומללה
> הרצאה של לארי וואל (Present Continuous, Future Perfect):
>
> https://web.archive.org/web/20100711071431/http://wiki.osdc.org.il/index.php/Larry_Wall_-_Present_Continuous%2C_Future_Perfect
> תימללו אותה 11 מתנדבים, כאשר שלומי פיש עשה את רוב העבודה.
>
> --- עומר זק
>
>
>
>
>
>
>
>
>
> _______________________________________________
> Discussions mailing list
> Discussions@hamakor.org.il
> http://hamakor.org.il/cgi-bin/mailman/listinfo/discussions
>
_______________________________________________
Discussions mailing list
Discussions@hamakor.org.il
http://hamakor.org.il/cgi-bin/mailman/listinfo/discussions

לענות