@11
בתוכנה של יעקובוב: 1. הוא בנה מאגר בסיסי שמגיע עם התוכנה. 2. ו-3. מיושמים הלכה למעשה, כאשר 4. הוא על ידי המשתמש עצמו, ויכול לבחור פר ספר איזה מילון מילים, ולהוסיף זיהוי וודאי לאותיות ספציפיות הקיימות בספר זה בלבד - ליצור לכל ספר בפני עצמו מאגר מילים נפוצות, ומאגר OCR ייחודי, ולכן כל זמן שזה מודפס - תמונת מילים שחוזרת על עצמה באופן קבוע, רמת הדיוק של התוכנה שלו גבוהה.
הבעיה מתחילה כאשר יש לך אותיות שבורות חצויות וכדומה, שאז צריך לאמן את התוכנה מחדש על עשרות ווריאציות חדשות שלא קיימות בשום מאגר בעולם.
ולא, לא באתי לפרסם את התוכנה שלו, אלא מהתנסות איתה [שילמתי עליה טבין ותקילין, והגעתי למצב שבכתב רש"י ברור וחד, היו טעויות רק במילים חדשות].