https://bz.apache.org/bugzilla/show_bug.cgi?id=60833
--- Comment #8 from Tim Allison <[email protected]> --- We have 15 stacktraces like this in our regression corpus for Tika. I was hoping from the file attached here (first) and the file attached on Bug 57093 (second), that the first byte or two specified a length somehow. However, from govdocs1 085890.xls (third), it looks like junk at the end of the font record. By junk, of course, I mean, "I don't understand why it's there"...like junk DNA. :) But seriously, in 085890.xls, when I open the file in Excel and search for "providing", I don't find anything. First line is font name : length Remaining lines are: byte index : byte&0xff : char (if above 20) FONT NAME:黑体 : 2 0 : 0 : 1 : 0 : 2 : 0 : 3 : 0 : FONT NAME:MS Sans Serif : 13 0 : 19 : 1 : 0 : 2 : 1 : 3 : 0 : 4 : 0 : 5 : 88 : X 6 : 1 : 7 : 0 : 8 : 0 : 9 : 89 : Y 10 : 95 : _ 11 : 41 : ) 12 : 63 : ? 13 : 95 : _ 14 : 41 : ) 15 : 59 : ; 16 : 95 : _ 17 : 40 : ( 18 : 64 : @ 19 : 95 : _ 20 : 41 : ) 21 : 0 : FONT NAME:MS Sans Serif : 13 0 : 116 : t 1 : 129 : 2 : 84 : T 3 : 73 : I 4 : 84 : T 5 : 85 : U 6 : 84 : T 7 : 73 : I 8 : 79 : O 9 : 78 : N 10 : 95 : _ 11 : 80 : P 12 : 82 : R 13 : 79 : O 14 : 86 : V 15 : 73 : I 16 : 68 : D 17 : 73 : I 18 : 78 : N 19 : 71 : G 20 : 95 : _ 21 : 68 : D 22 : 65 : A 23 : 84 : T 24 : 65 : A 25 : 95 : _ 26 : 73 : I 27 : 68 : D 28 : 10 : 29 : 0 : 30 : 0 : 31 : 67 : C 32 : 79 : O 33 : 78 : N 34 : 84 : T 35 : 65 : A 36 : 67 : C 37 : 84 : T 38 : 95 : _ 39 : 73 : I 40 : 68 : D 41 : 20 : -- You are receiving this mail because: You are the assignee for the bug. --------------------------------------------------------------------- To unsubscribe, e-mail: [email protected] For additional commands, e-mail: [email protected]
