באג | באג בחיפוש בקבצי PDF
-
בלי קשר לבאג שהיה בימים האחרונים בקבצי PDF יש באג מהותי!
באג בקבצי PDF של תלמוד בבלי
מאז ששופר הצגת תוצאות חיפוש בPDF זה מזהה בהרבה קבצים את כל התוים של ה- OCR כאילו זה נקודות וכו'
מצורף השוואה לגירסה ישנה של אוצריא (באותם קבצי PDF), פעם זה עבד יפה מאד החיפוש הפנימי בקובץ והיום לא.
הבעיה גם באינדוקס כללי של הספרים שלא מזוהה טקסט בכלל ב- OCR בהרבה קבצים
כך נראה התוכן של קבצי PDF כיום בחיפוש
וכך היה נראה פעם התוכן של קבצי PDF בחיפוש:

-
י יהודי צעיר סימן נושא זה כשאלה