source/libs/poppler/poppler-src/poppler/XRef.cc

   1 //========================================================================
   2 //
   3 // XRef.cc
   4 //
   5 // Copyright 1996-2003 Glyph & Cog, LLC
   6 //
   7 //========================================================================
   8
   9 //========================================================================
  10 //
  11 // Modified under the Poppler project - http://poppler.freedesktop.org
  12 //
  13 // All changes made under the Poppler project to this file are licensed
  14 // under GPL version 2 or later
  15 //
  16 // Copyright (C) 2005 Dan Sheridan <dan.sheridan@postman.org.uk>
  17 // Copyright (C) 2005 Brad Hards <bradh@frogmouth.net>
  18 // Copyright (C) 2006, 2008, 2010, 2012-2014 Albert Astals Cid <aacid@kde.org>
  19 // Copyright (C) 2007-2008 Julien Rebetez <julienr@svn.gnome.org>
  20 // Copyright (C) 2007 Carlos Garcia Campos <carlosgc@gnome.org>
  21 // Copyright (C) 2009, 2010 Ilya Gorenbein <igorenbein@finjan.com>
  22 // Copyright (C) 2010 Hib Eris <hib@hiberis.nl>
  23 // Copyright (C) 2012, 2013 Thomas Freitag <Thomas.Freitag@kabelmail.de>
  24 // Copyright (C) 2012, 2013 Fabio D'Urso <fabiodurso@hotmail.it>
  25 // Copyright (C) 2013, 2014 Adrian Johnson <ajohnson@redneon.com>
  26 // Copyright (C) 2013 Pino Toscano <pino@kde.org>
  27 //
  28 // To see a description of the changes please see the Changelog file that
  29 // came with your tarball or type make ChangeLog if you are building from git
  30 //
  31 //========================================================================
  32
  33 #include <config.h>
  34
  35 #ifdef USE_GCC_PRAGMAS
  36 #pragma implementation
  37 #endif
  38
  39 #include <stdlib.h>
  40 #include <stddef.h>
  41 #include <string.h>
  42 #include <math.h>
  43 #include <ctype.h>
  44 #include <limits.h>
  45 #include <float.h>
  46 #include "goo/gfile.h"
  47 #include "goo/gmem.h"
  48 #include "Object.h"
  49 #include "Stream.h"
  50 #include "Lexer.h"
  51 #include "Parser.h"
  52 #include "Dict.h"
  53 #include "Error.h"
  54 #include "ErrorCodes.h"
  55 #include "XRef.h"
  56 #include "PopplerCache.h"
  57
  58 //------------------------------------------------------------------------
  59 // Permission bits
  60 // Note that the PDF spec uses 1 base (eg bit 3 is 1<<2)
  61 //------------------------------------------------------------------------
  62
  63 #define permPrint         (1<<2)  // bit 3
  64 #define permChange        (1<<3)  // bit 4
  65 #define permCopy          (1<<4)  // bit 5
  66 #define permNotes         (1<<5)  // bit 6
  67 #define permFillForm      (1<<8)  // bit 9
  68 #define permAccessibility (1<<9)  // bit 10
  69 #define permAssemble      (1<<10) // bit 11
  70 #define permHighResPrint  (1<<11) // bit 12
  71 #define defPermFlags 0xfffc
  72
  73 #if MULTITHREADED
  74 #  define xrefLocker()   MutexLocker locker(&mutex)
  75 #  define xrefCondLocker(X)  MutexLocker locker(&mutex, (X))
  76 #else
  77 #  define xrefLocker()
  78 #  define xrefCondLocker(X)
  79 #endif
  80
  81 //------------------------------------------------------------------------
  82 // ObjectStream
  83 //------------------------------------------------------------------------
  84
  85 class ObjectStream {
  86 public:
  87
  88   // Create an object stream, using object number <objStrNum>,
  89   // generation 0.
  90   ObjectStream(XRef *xref, int objStrNumA, int recursion = 0);
  91
  92   GBool isOk() { return ok; }
  93
  94   ~ObjectStream();
  95
  96   // Return the object number of this object stream.
  97   int getObjStrNum() { return objStrNum; }
  98
  99   // Get the <objIdx>th object from this stream, which should be
 100   // object number <objNum>, generation 0.
 101   Object *getObject(int objIdx, int objNum, Object *obj);
 102
 103 private:
 104
 105   int objStrNum;                // object number of the object stream
 106   int nObjects;                 // number of objects in the stream
 107   Object *objs;                 // the objects (length = nObjects)
 108   int *objNums;                 // the object numbers (length = nObjects)
 109   GBool ok;
 110 };
 111
 112 class ObjectStreamKey : public PopplerCacheKey
 113 {
 114   public:
 115     ObjectStreamKey(int num) : objStrNum(num)
 116     {
 117     }
 118
 119     bool operator==(const PopplerCacheKey &key) const
 120     {
 121       const ObjectStreamKey *k = static_cast<const ObjectStreamKey*>(&key);
 122       return objStrNum == k->objStrNum;
 123     }
 124
 125     const int objStrNum;
 126 };
 127
 128 class ObjectStreamItem : public PopplerCacheItem
 129 {
 130   public:
 131     ObjectStreamItem(ObjectStream *objStr) : objStream(objStr)
 132     {
 133     }
 134
 135     ~ObjectStreamItem()
 136     {
 137       delete objStream;
 138     }
 139
 140     ObjectStream *objStream;
 141 };
 142
 143 ObjectStream::ObjectStream(XRef *xref, int objStrNumA, int recursion) {
 144   Stream *str;
 145   Parser *parser;
 146   Goffset *offsets;
 147   Object objStr, obj1, obj2;
 148   Goffset first;
 149   int i;
 150
 151   objStrNum = objStrNumA;
 152   nObjects = 0;
 153   objs = NULL;
 154   objNums = NULL;
 155   ok = gFalse;
 156
 157   if (!xref->fetch(objStrNum, 0, &objStr, recursion)->isStream()) {
 158     goto err1;
 159   }
 160
 161   if (!objStr.streamGetDict()->lookup("N", &obj1, recursion)->isInt()) {
 162     obj1.free();
 163     goto err1;
 164   }
 165   nObjects = obj1.getInt();
 166   obj1.free();
 167   if (nObjects <= 0) {
 168     goto err1;
 169   }
 170
 171   objStr.streamGetDict()->lookup("First", &obj1, recursion);
 172   if (!obj1.isInt() && !obj1.isInt64()) {
 173     obj1.free();
 174     goto err1;
 175   }
 176   if (obj1.isInt())
 177     first = obj1.getInt();
 178   else
 179     first = obj1.getInt64();
 180   obj1.free();
 181   if (first < 0) {
 182     goto err1;
 183   }
 184
 185   // this is an arbitrary limit to avoid integer overflow problems
 186   // in the 'new Object[nObjects]' call (Acrobat apparently limits
 187   // object streams to 100-200 objects)
 188   if (nObjects > 1000000) {
 189     error(errSyntaxError, -1, "Too many objects in an object stream");
 190     goto err1;
 191   }
 192   objs = new Object[nObjects];
 193   objNums = (int *)gmallocn(nObjects, sizeof(int));
 194   offsets = (Goffset *)gmallocn(nObjects, sizeof(Goffset));
 195
 196   // parse the header: object numbers and offsets
 197   objStr.streamReset();
 198   obj1.initNull();
 199   str = new EmbedStream(objStr.getStream(), &obj1, gTrue, first);
 200   parser = new Parser(xref, new Lexer(xref, str), gFalse);
 201   for (i = 0; i < nObjects; ++i) {
 202     parser->getObj(&obj1);
 203     parser->getObj(&obj2);
 204     if (!obj1.isInt() || !(obj2.isInt() || obj2.isInt64())) {
 205       obj1.free();
 206       obj2.free();
 207       delete parser;
 208       gfree(offsets);
 209       goto err1;
 210     }
 211     objNums[i] = obj1.getInt();
 212     if (obj2.isInt())
 213       offsets[i] = obj2.getInt();
 214     else
 215       offsets[i] = obj2.getInt64();
 216     obj1.free();
 217     obj2.free();
 218     if (objNums[i] < 0 || offsets[i] < 0 ||
 219         (i > 0 && offsets[i] < offsets[i-1])) {
 220       delete parser;
 221       gfree(offsets);
 222       goto err1;
 223     }
 224   }
 225   while (str->getChar() != EOF) ;
 226   delete parser;
 227
 228   // skip to the first object - this shouldn't be necessary because
 229   // the First key is supposed to be equal to offsets[0], but just in
 230   // case...
 231   for (Goffset pos = first; pos < offsets[0]; ++pos) {
 232     objStr.getStream()->getChar();
 233   }
 234
 235   // parse the objects
 236   for (i = 0; i < nObjects; ++i) {
 237     obj1.initNull();
 238     if (i == nObjects - 1) {
 239       str = new EmbedStream(objStr.getStream(), &obj1, gFalse, 0);
 240     } else {
 241       str = new EmbedStream(objStr.getStream(), &obj1, gTrue,
 242                             offsets[i+1] - offsets[i]);
 243     }
 244     parser = new Parser(xref, new Lexer(xref, str), gFalse);
 245     parser->getObj(&objs[i]);
 246     while (str->getChar() != EOF) ;
 247     delete parser;
 248   }
 249
 250   gfree(offsets);
 251   ok = gTrue;
 252
 253  err1:
 254   objStr.free();
 255 }
 256
 257 ObjectStream::~ObjectStream() {
 258   int i;
 259
 260   if (objs) {
 261     for (i = 0; i < nObjects; ++i) {
 262       objs[i].free();
 263     }
 264     delete[] objs;
 265   }
 266   gfree(objNums);
 267 }
 268
 269 Object *ObjectStream::getObject(int objIdx, int objNum, Object *obj) {
 270   if (objIdx < 0 || objIdx >= nObjects || objNum != objNums[objIdx]) {
 271     return obj->initNull();
 272   }
 273   return objs[objIdx].copy(obj);
 274 }
 275
 276 //------------------------------------------------------------------------
 277 // XRef
 278 //------------------------------------------------------------------------
 279
 280 void XRef::init() {
 281 #if MULTITHREADED
 282   gInitMutex(&mutex);
 283 #endif
 284   ok = gTrue;
 285   errCode = errNone;
 286   entries = NULL;
 287   capacity = 0;
 288   size = 0;
 289   streamEnds = NULL;
 290   streamEndsLen = 0;
 291   objStrs = new PopplerCache(5);
 292   mainXRefEntriesOffset = 0;
 293   xRefStream = gFalse;
 294   scannedSpecialFlags = gFalse;
 295   encrypted = gFalse;
 296   permFlags = defPermFlags;
 297   ownerPasswordOk = gFalse;
 298   rootNum = -1;
 299   strOwner = gFalse;
 300 }
 301
 302 XRef::XRef() {
 303   init();
 304 }
 305
 306 XRef::XRef(Object *trailerDictA) {
 307   init();
 308
 309   if (trailerDictA->isDict())
 310     trailerDict.initDict(trailerDictA->getDict());
 311 }
 312
 313 XRef::XRef(BaseStream *strA, Goffset pos, Goffset mainXRefEntriesOffsetA, GBool *wasReconstructed, GBool reconstruct) {
 314   Object obj;
 315
 316   init();
 317   mainXRefEntriesOffset = mainXRefEntriesOffsetA;
 318
 319   // read the trailer
 320   str = strA;
 321   start = str->getStart();
 322   prevXRefOffset = mainXRefOffset = pos;
 323
 324   if (reconstruct && !(ok = constructXRef(wasReconstructed)))
 325   {
 326     errCode = errDamaged;
 327     return;
 328   }
 329   else
 330   {
 331     // if there was a problem with the 'startxref' position, try to
 332     // reconstruct the xref table
 333     if (prevXRefOffset == 0) {
 334       if (!(ok = constructXRef(wasReconstructed))) {
 335         errCode = errDamaged;
 336         return;
 337       }
 338
 339     // read the xref table
 340     } else {
 341       std::vector<Goffset> followedXRefStm;
 342       readXRef(&prevXRefOffset, &followedXRefStm, NULL);
 343
 344       // if there was a problem with the xref table,
 345       // try to reconstruct it
 346       if (!ok) {
 347         if (!(ok = constructXRef(wasReconstructed))) {
 348           errCode = errDamaged;
 349           return;
 350         }
 351       }
 352     }
 353
 354     // set size to (at least) the size specified in trailer dict
 355     trailerDict.dictLookupNF("Size", &obj);
 356     if (!obj.isInt()) {
 357         error(errSyntaxWarning, -1, "No valid XRef size in trailer");
 358     } else {
 359       if (obj.getInt() > size) {
 360          if (resize(obj.getInt()) != obj.getInt()) {
 361             if (!(ok = constructXRef(wasReconstructed))) {
 362                obj.free();
 363                errCode = errDamaged;
 364                return;
 365             }
 366          }
 367       }
 368     }
 369     obj.free();
 370
 371     // get the root dictionary (catalog) object
 372     trailerDict.dictLookupNF("Root", &obj);
 373     if (obj.isRef()) {
 374       rootNum = obj.getRefNum();
 375       rootGen = obj.getRefGen();
 376       obj.free();
 377     } else {
 378       obj.free();
 379       if (!(ok = constructXRef(wasReconstructed))) {
 380         errCode = errDamaged;
 381         return;
 382       }
 383     }
 384   }
 385   // now set the trailer dictionary's xref pointer so we can fetch
 386   // indirect objects from it
 387   trailerDict.getDict()->setXRef(this);
 388 }
 389
 390 XRef::~XRef() {
 391   for(int i=0; i<size; i++) {
 392       entries[i].obj.free ();
 393   }
 394   gfree(entries);
 395
 396   trailerDict.free();
 397   if (streamEnds) {
 398     gfree(streamEnds);
 399   }
 400   if (objStrs) {
 401     delete objStrs;
 402   }
 403   if (strOwner) {
 404     delete str;
 405   }
 406 #if MULTITHREADED
 407   gDestroyMutex(&mutex);
 408 #endif
 409 }
 410
 411 XRef *XRef::copy() {
 412   XRef *xref = new XRef();
 413   xref->str = str->copy();
 414   xref->strOwner = gTrue;
 415   xref->encrypted = encrypted;
 416   xref->permFlags = permFlags;
 417   xref->ownerPasswordOk = ownerPasswordOk;
 418   xref->rootGen = rootGen;
 419   xref->rootNum = rootNum;
 420
 421   xref->start = start;
 422   xref->prevXRefOffset = prevXRefOffset;
 423   xref->mainXRefEntriesOffset = mainXRefEntriesOffset;
 424   xref->xRefStream = xRefStream;
 425   trailerDict.copy(&xref->trailerDict);
 426   xref->encAlgorithm = encAlgorithm;
 427   xref->encRevision = encRevision;
 428   xref->encVersion = encVersion;
 429   xref->permFlags = permFlags;
 430   xref->keyLength = keyLength;
 431   xref->permFlags = permFlags;
 432   for (int i = 0; i < 32; i++) {
 433     xref->fileKey[i] = fileKey[i];
 434   }
 435
 436   if (xref->reserve(size) == 0) {
 437     error(errSyntaxError, -1, "unable to allocate {0:d} entries", size);
 438     delete xref;
 439     return NULL;
 440   }
 441   xref->size = size;
 442   for (int i = 0; i < size; ++i) {
 443     xref->entries[i].offset = entries[i].offset;
 444     xref->entries[i].type = entries[i].type;
 445     xref->entries[i].obj.initNull ();
 446     xref->entries[i].flags = entries[i].flags;
 447     xref->entries[i].gen = entries[i].gen;
 448   }
 449   xref->streamEndsLen = streamEndsLen;
 450   if (streamEndsLen  != 0) {
 451     xref->streamEnds = (Goffset *)gmalloc(streamEndsLen * sizeof(Goffset));
 452     for (int i = 0; i < streamEndsLen; i++) {
 453       xref->streamEnds[i] = streamEnds[i];
 454     }
 455   }
 456   return xref;
 457 }
 458
 459 int XRef::reserve(int newSize)
 460 {
 461   if (newSize > capacity) {
 462
 463     int realNewSize;
 464     for (realNewSize = capacity ? 2 * capacity : 1024;
 465           newSize > realNewSize && realNewSize > 0;
 466           realNewSize <<= 1) ;
 467     if ((realNewSize < 0) ||
 468         (realNewSize >= INT_MAX / (int)sizeof(XRefEntry))) {
 469       return 0;
 470     }
 471
 472     void *p = greallocn_checkoverflow(entries, realNewSize, sizeof(XRefEntry));
 473     if (p == NULL) {
 474       return 0;
 475     }
 476
 477     entries = (XRefEntry *) p;
 478     capacity = realNewSize;
 479
 480   }
 481
 482   return capacity;
 483 }
 484
 485 int XRef::resize(int newSize)
 486 {
 487   if (newSize > size) {
 488
 489     if (reserve(newSize) < newSize) return size;
 490
 491     for (int i = size; i < newSize; ++i) {
 492       entries[i].offset = -1;
 493       entries[i].type = xrefEntryNone;
 494       entries[i].obj.initNull ();
 495       entries[i].flags = 0;
 496       entries[i].gen = 0;
 497     }
 498   } else {
 499     for (int i = newSize; i < size; i++) {
 500       entries[i].obj.free ();
 501     }
 502   }
 503
 504   size = newSize;
 505
 506   return size;
 507 }
 508
 509 /* Read one xref table section.  Also reads the associated trailer
 510  * dictionary, and returns the prev pointer (if any).
 511  * Arguments:
 512  *   pos                Points to a Goffset containing the offset of the XRef
 513  *                      section to be read. If a prev pointer is found, *pos is
 514  *                      updated with its value
 515  *   followedXRefStm    Used in case of nested readXRef calls to spot circular
 516  *                      references in XRefStm pointers
 517  *   xrefStreamObjsNum  If not NULL, every time a XRef stream is encountered,
 518  *                      its object number is appended
 519  * Return value:
 520  *   gTrue if a prev pointer is found, otherwise gFalse
 521  */
 522 GBool XRef::readXRef(Goffset *pos, std::vector<Goffset> *followedXRefStm, std::vector<int> *xrefStreamObjsNum) {
 523   Parser *parser;
 524   Object obj;
 525   GBool more;
 526
 527   // start up a parser, parse one token
 528   obj.initNull();
 529   parser = new Parser(NULL,
 530              new Lexer(NULL,
 531                str->makeSubStream(start + *pos, gFalse, 0, &obj)),
 532              gTrue);
 533   parser->getObj(&obj, gTrue);
 534
 535   // parse an old-style xref table
 536   if (obj.isCmd("xref")) {
 537     obj.free();
 538     more = readXRefTable(parser, pos, followedXRefStm, xrefStreamObjsNum);
 539
 540   // parse an xref stream
 541   } else if (obj.isInt()) {
 542     const int objNum = obj.getInt();
 543     obj.free();
 544     if (!parser->getObj(&obj, gTrue)->isInt()) {
 545       goto err1;
 546     }
 547     obj.free();
 548     if (!parser->getObj(&obj, gTrue)->isCmd("obj")) {
 549       goto err1;
 550     }
 551     obj.free();
 552     if (!parser->getObj(&obj)->isStream()) {
 553       goto err1;
 554     }
 555     if (trailerDict.isNone()) {
 556       xRefStream = gTrue;
 557     }
 558     if (xrefStreamObjsNum) {
 559       xrefStreamObjsNum->push_back(objNum);
 560     }
 561     more = readXRefStream(obj.getStream(), pos);
 562     obj.free();
 563
 564   } else {
 565     goto err1;
 566   }
 567
 568   delete parser;
 569   return more;
 570
 571  err1:
 572   obj.free();
 573   delete parser;
 574   ok = gFalse;
 575   return gFalse;
 576 }
 577
 578 GBool XRef::readXRefTable(Parser *parser, Goffset *pos, std::vector<Goffset> *followedXRefStm, std::vector<int> *xrefStreamObjsNum) {
 579   XRefEntry entry;
 580   GBool more;
 581   Object obj, obj2;
 582   Goffset pos2;
 583   int first, n, i;
 584
 585   while (1) {
 586     parser->getObj(&obj, gTrue);
 587     if (obj.isCmd("trailer")) {
 588       obj.free();
 589       break;
 590     }
 591     if (!obj.isInt()) {
 592       goto err1;
 593     }
 594     first = obj.getInt();
 595     obj.free();
 596     if (!parser->getObj(&obj, gTrue)->isInt()) {
 597       goto err1;
 598     }
 599     n = obj.getInt();
 600     obj.free();
 601     if (first < 0 || n < 0 || first + n < 0) {
 602       goto err0;
 603     }
 604     if (first + n > size) {
 605       if (resize(first + n) != first + n) {
 606         error(errSyntaxError, -1, "Invalid 'obj' parameters'");
 607         goto err0;
 608       }
 609     }
 610     for (i = first; i < first + n; ++i) {
 611       parser->getObj(&obj, gTrue);
 612       if (obj.isInt()) {
 613         entry.offset = obj.getInt();
 614       } else if (obj.isInt64()) {
 615         entry.offset = obj.getInt64();
 616       } else {
 617         goto err1;
 618       }
 619       obj.free();
 620       if (!parser->getObj(&obj, gTrue)->isInt()) {
 621         goto err1;
 622       }
 623       entry.gen = obj.getInt();
 624       entry.obj.initNull ();
 625       entry.flags = 0;
 626       obj.free();
 627       parser->getObj(&obj, gTrue);
 628       if (obj.isCmd("n")) {
 629         entry.type = xrefEntryUncompressed;
 630       } else if (obj.isCmd("f")) {
 631         entry.type = xrefEntryFree;
 632       } else {
 633         goto err1;
 634       }
 635       obj.free();
 636       if (entries[i].offset == -1) {
 637         entries[i] = entry;
 638         // PDF files of patents from the IBM Intellectual Property
 639         // Network have a bug: the xref table claims to start at 1
 640         // instead of 0.
 641         if (i == 1 && first == 1 &&
 642             entries[1].offset == 0 && entries[1].gen == 65535 &&
 643             entries[1].type == xrefEntryFree) {
 644           i = first = 0;
 645           entries[0] = entries[1];
 646           entries[1].offset = -1;
 647         }
 648       }
 649     }
 650   }
 651
 652   // read the trailer dictionary
 653   if (!parser->getObj(&obj)->isDict()) {
 654     goto err1;
 655   }
 656
 657   // get the 'Prev' pointer
 658   obj.getDict()->lookupNF("Prev", &obj2);
 659   if (obj2.isInt() || obj2.isInt64()) {
 660     if (obj2.isInt())
 661       pos2 = obj2.getInt();
 662     else
 663       pos2 = obj2.getInt64();
 664     if (pos2 != *pos) {
 665       *pos = pos2;
 666       more = gTrue;
 667     } else {
 668       error(errSyntaxWarning, -1, "Infinite loop in xref table");
 669       more = gFalse;
 670     }
 671   } else if (obj2.isRef()) {
 672     // certain buggy PDF generators generate "/Prev NNN 0 R" instead
 673     // of "/Prev NNN"
 674     pos2 = (Guint)obj2.getRefNum();
 675     if (pos2 != *pos) {
 676       *pos = pos2;
 677       more = gTrue;
 678     } else {
 679       error(errSyntaxWarning, -1, "Infinite loop in xref table");
 680       more = gFalse;
 681     }
 682   } else {
 683     more = gFalse;
 684   }
 685   obj2.free();
 686
 687   // save the first trailer dictionary
 688   if (trailerDict.isNone()) {
 689     obj.copy(&trailerDict);
 690   }
 691
 692   // check for an 'XRefStm' key
 693   obj.getDict()->lookup("XRefStm", &obj2);
 694   if (obj2.isInt() || obj2.isInt64()) {
 695     if (obj2.isInt())
 696       pos2 = obj2.getInt();
 697     else
 698       pos2 = obj2.getInt64();
 699     for (size_t i = 0; ok == gTrue && i < followedXRefStm->size(); ++i) {
 700       if (followedXRefStm->at(i) == pos2) {
 701         ok = gFalse;
 702       }
 703     }
 704     if (ok) {
 705       followedXRefStm->push_back(pos2);
 706       readXRef(&pos2, followedXRefStm, xrefStreamObjsNum);
 707     }
 708     if (!ok) {
 709       obj2.free();
 710       goto err1;
 711     }
 712   }
 713   obj2.free();
 714
 715   obj.free();
 716   return more;
 717
 718  err1:
 719   obj.free();
 720  err0:
 721   ok = gFalse;
 722   return gFalse;
 723 }
 724
 725 GBool XRef::readXRefStream(Stream *xrefStr, Goffset *pos) {
 726   Dict *dict;
 727   int w[3];
 728   GBool more;
 729   Object obj, obj2, idx;
 730   int newSize, first, n, i;
 731
 732   dict = xrefStr->getDict();
 733
 734   if (!dict->lookupNF("Size", &obj)->isInt()) {
 735     goto err1;
 736   }
 737   newSize = obj.getInt();
 738   obj.free();
 739   if (newSize < 0) {
 740     goto err1;
 741   }
 742   if (newSize > size) {
 743     if (resize(newSize) != newSize) {
 744       error(errSyntaxError, -1, "Invalid 'size' parameter");
 745       goto err0;
 746     }
 747   }
 748
 749   if (!dict->lookupNF("W", &obj)->isArray() ||
 750       obj.arrayGetLength() < 3) {
 751     goto err1;
 752   }
 753   for (i = 0; i < 3; ++i) {
 754     if (!obj.arrayGet(i, &obj2)->isInt()) {
 755       obj2.free();
 756       goto err1;
 757     }
 758     w[i] = obj2.getInt();
 759     obj2.free();
 760     if (w[i] < 0) {
 761       goto err1;
 762     }
 763   }
 764   obj.free();
 765   if (w[0] > (int)sizeof(int) || w[1] > (int)sizeof(long long) || w[2] > (int)sizeof(int)) {
 766     goto err1;
 767   }
 768
 769   xrefStr->reset();
 770   dict->lookupNF("Index", &idx);
 771   if (idx.isArray()) {
 772     for (i = 0; i+1 < idx.arrayGetLength(); i += 2) {
 773       if (!idx.arrayGet(i, &obj)->isInt()) {
 774         idx.free();
 775         goto err1;
 776       }
 777       first = obj.getInt();
 778       obj.free();
 779       if (!idx.arrayGet(i+1, &obj)->isInt()) {
 780         idx.free();
 781         goto err1;
 782       }
 783       n = obj.getInt();
 784       obj.free();
 785       if (first < 0 || n < 0 ||
 786           !readXRefStreamSection(xrefStr, w, first, n)) {
 787         idx.free();
 788         goto err0;
 789       }
 790     }
 791   } else {
 792     if (!readXRefStreamSection(xrefStr, w, 0, newSize)) {
 793       idx.free();
 794       goto err0;
 795     }
 796   }
 797   idx.free();
 798
 799   dict->lookupNF("Prev", &obj);
 800   if (obj.isInt()) {
 801     *pos = obj.getInt();
 802     more = gTrue;
 803   } else if (obj.isInt64()) {
 804     *pos = obj.getInt64();
 805     more = gTrue;
 806   } else {
 807     more = gFalse;
 808   }
 809   obj.free();
 810   if (trailerDict.isNone()) {
 811     trailerDict.initDict(dict);
 812   }
 813
 814   return more;
 815
 816  err1:
 817   obj.free();
 818  err0:
 819   ok = gFalse;
 820   return gFalse;
 821 }
 822
 823 GBool XRef::readXRefStreamSection(Stream *xrefStr, int *w, int first, int n) {
 824   unsigned long long offset;
 825   int type, gen, c, i, j;
 826
 827   if (first + n < 0) {
 828     return gFalse;
 829   }
 830   if (first + n > size) {
 831     if (resize(first + n) != size) {
 832       error(errSyntaxError, -1, "Invalid 'size' inside xref table");
 833       return gFalse;
 834     }
 835     if (first + n > size) {
 836       error(errSyntaxError, -1, "Invalid 'first' or 'n' inside xref table");
 837       return gFalse;
 838     }
 839   }
 840   for (i = first; i < first + n; ++i) {
 841     if (w[0] == 0) {
 842       type = 1;
 843     } else {
 844       for (type = 0, j = 0; j < w[0]; ++j) {
 845         if ((c = xrefStr->getChar()) == EOF) {
 846           return gFalse;
 847         }
 848         type = (type << 8) + c;
 849       }
 850     }
 851     for (offset = 0, j = 0; j < w[1]; ++j) {
 852       if ((c = xrefStr->getChar()) == EOF) {
 853         return gFalse;
 854       }
 855       offset = (offset << 8) + c;
 856     }
 857     if (offset > (unsigned long long)GoffsetMax()) {
 858       error(errSyntaxError, -1, "Offset inside xref table too large for fseek");
 859       return gFalse;
 860     }
 861     for (gen = 0, j = 0; j < w[2]; ++j) {
 862       if ((c = xrefStr->getChar()) == EOF) {
 863         return gFalse;
 864       }
 865       gen = (gen << 8) + c;
 866     }
 867     if (entries[i].offset == -1) {
 868       switch (type) {
 869       case 0:
 870         entries[i].offset = offset;
 871         entries[i].gen = gen;
 872         entries[i].type = xrefEntryFree;
 873         break;
 874       case 1:
 875         entries[i].offset = offset;
 876         entries[i].gen = gen;
 877         entries[i].type = xrefEntryUncompressed;
 878         break;
 879       case 2:
 880         entries[i].offset = offset;
 881         entries[i].gen = gen;
 882         entries[i].type = xrefEntryCompressed;
 883         break;
 884       default:
 885         return gFalse;
 886       }
 887     }
 888   }
 889
 890   return gTrue;
 891 }
 892
 893 // Attempt to construct an xref table for a damaged file.
 894 GBool XRef::constructXRef(GBool *wasReconstructed, GBool needCatalogDict) {
 895   Parser *parser;
 896   Object newTrailerDict, obj;
 897   char buf[256];
 898   Goffset pos;
 899   int num, gen;
 900   int newSize;
 901   int streamEndsSize;
 902   char *p;
 903   GBool gotRoot;
 904   char* token = NULL;
 905   bool oneCycle = true;
 906   int offset = 0;
 907
 908   gfree(entries);
 909   capacity = 0;
 910   size = 0;
 911   entries = NULL;
 912
 913   gotRoot = gFalse;
 914   streamEndsLen = streamEndsSize = 0;
 915
 916   if (wasReconstructed)
 917   {
 918     *wasReconstructed = true;
 919   }
 920
 921   str->reset();
 922   while (1) {
 923     pos = str->getPos();
 924     if (!str->getLine(buf, 256)) {
 925       break;
 926     }
 927     p = buf;
 928
 929     // skip whitespace
 930     while (*p && Lexer::isSpace(*p & 0xff)) ++p;
 931
 932     oneCycle = true;
 933     offset = 0;
 934
 935     while( ( token = strstr( p, "endobj" ) ) || oneCycle ) {
 936       oneCycle = false;
 937
 938       if( token ) {
 939         oneCycle = true;
 940         token[0] = '\0';
 941         offset = token - p;
 942       }
 943
 944       // got trailer dictionary
 945       if (!strncmp(p, "trailer", 7)) {
 946         obj.initNull();
 947         parser = new Parser(NULL,
 948                  new Lexer(NULL,
 949                    str->makeSubStream(pos + 7, gFalse, 0, &obj)),
 950                  gFalse);
 951         parser->getObj(&newTrailerDict);
 952         if (newTrailerDict.isDict()) {
 953           newTrailerDict.dictLookupNF("Root", &obj);
 954           if (obj.isRef() && (!gotRoot || !needCatalogDict) && rootNum != obj.getRefNum()) {
 955             rootNum = obj.getRefNum();
 956             rootGen = obj.getRefGen();
 957             if (!trailerDict.isNone()) {
 958               trailerDict.free();
 959             }
 960             newTrailerDict.copy(&trailerDict);
 961             gotRoot = gTrue;
 962           }
 963           obj.free();
 964         }
 965         newTrailerDict.free();
 966         delete parser;
 967
 968       // look for object
 969     } else if (isdigit(*p & 0xff)) {
 970       num = atoi(p);
 971       if (num > 0) {
 972         do {
 973           ++p;
 974         } while (*p && isdigit(*p & 0xff));
 975         if (isspace(*p & 0xff)) {
 976           do {
 977             ++p;
 978           } while (*p && isspace(*p & 0xff));
 979           if (isdigit(*p & 0xff)) {
 980             gen = atoi(p);
 981             do {
 982               ++p;
 983             } while (*p && isdigit(*p & 0xff));
 984             if (isspace(*p & 0xff)) {
 985               do {
 986                 ++p;
 987               } while (*p && isspace(*p & 0xff));
 988               if (!strncmp(p, "obj", 3)) {
 989                 if (num >= size) {
 990                   newSize = (num + 1 + 255) & ~255;
 991                   if (newSize < 0) {
 992                     error(errSyntaxError, -1, "Bad object number");
 993                     return gFalse;
 994                   }
 995                     if (resize(newSize) != newSize) {
 996                       error(errSyntaxError, -1, "Invalid 'obj' parameters");
 997                       return gFalse;
 998                     }
 999                   }
1000                   if (entries[num].type == xrefEntryFree ||
1001                       gen >= entries[num].gen) {
1002                     entries[num].offset = pos - start;
1003                     entries[num].gen = gen;
1004                     entries[num].type = xrefEntryUncompressed;
1005                 }
1006                 }
1007               }
1008             }
1009           }
1010         }
1011
1012       } else if (!strncmp(p, "endstream", 9)) {
1013         if (streamEndsLen == streamEndsSize) {
1014           streamEndsSize += 64;
1015           if (streamEndsSize >= INT_MAX / (int)sizeof(int)) {
1016             error(errSyntaxError, -1, "Invalid 'endstream' parameter.");
1017             return gFalse;
1018           }
1019           streamEnds = (Goffset *)greallocn(streamEnds,
1020                                         streamEndsSize, sizeof(Goffset));
1021         }
1022         streamEnds[streamEndsLen++] = pos;
1023       }
1024       if( token ) {
1025         p = token + 6;// strlen( "endobj" ) = 6
1026         pos += offset + 6;// strlen( "endobj" ) = 6
1027         while (*p && Lexer::isSpace(*p & 0xff)) {
1028           ++p;
1029           ++pos;
1030         }
1031       }
1032     }
1033   }
1034
1035   if (gotRoot)
1036     return gTrue;
1037
1038   error(errSyntaxError, -1, "Couldn't find trailer dictionary");
1039   return gFalse;
1040 }
1041
1042 void XRef::setEncryption(int permFlagsA, GBool ownerPasswordOkA,
1043                          Guchar *fileKeyA, int keyLengthA,
1044                          int encVersionA, int encRevisionA,
1045                          CryptAlgorithm encAlgorithmA) {
1046   int i;
1047
1048   encrypted = gTrue;
1049   permFlags = permFlagsA;
1050   ownerPasswordOk = ownerPasswordOkA;
1051   if (keyLengthA <= 32) {
1052     keyLength = keyLengthA;
1053   } else {
1054     keyLength = 32;
1055   }
1056   for (i = 0; i < keyLength; ++i) {
1057     fileKey[i] = fileKeyA[i];
1058   }
1059   encVersion = encVersionA;
1060   encRevision = encRevisionA;
1061   encAlgorithm = encAlgorithmA;
1062 }
1063
1064 void XRef::getEncryptionParameters(Guchar **fileKeyA, CryptAlgorithm *encAlgorithmA,
1065                               int *keyLengthA) {
1066   if (encrypted) {
1067     *fileKeyA = fileKey;
1068     *encAlgorithmA = encAlgorithm;
1069     *keyLengthA = keyLength;
1070   } else {
1071     // null encryption parameters
1072     *fileKeyA = NULL;
1073     *encAlgorithmA = cryptRC4;
1074     *keyLengthA = 0;
1075   }
1076 }
1077
1078 GBool XRef::okToPrint(GBool ignoreOwnerPW) {
1079   return (!ignoreOwnerPW && ownerPasswordOk) || (permFlags & permPrint);
1080 }
1081
1082 // we can print at high res if we are only doing security handler revision
1083 // 2 (and we are allowed to print at all), or with security handler rev
1084 // 3 and we are allowed to print, and bit 12 is set.
1085 GBool XRef::okToPrintHighRes(GBool ignoreOwnerPW) {
1086   if (encrypted) {
1087     if (2 == encRevision) {
1088       return (okToPrint(ignoreOwnerPW));
1089     } else if (encRevision >= 3) {
1090       return (okToPrint(ignoreOwnerPW) && (permFlags & permHighResPrint));
1091     } else {
1092       // something weird - unknown security handler version
1093       return gFalse;
1094     }
1095   } else {
1096     return gTrue;
1097   }
1098 }
1099
1100 GBool XRef::okToChange(GBool ignoreOwnerPW) {
1101   return (!ignoreOwnerPW && ownerPasswordOk) || (permFlags & permChange);
1102 }
1103
1104 GBool XRef::okToCopy(GBool ignoreOwnerPW) {
1105   return (!ignoreOwnerPW && ownerPasswordOk) || (permFlags & permCopy);
1106 }
1107
1108 GBool XRef::okToAddNotes(GBool ignoreOwnerPW) {
1109   return (!ignoreOwnerPW && ownerPasswordOk) || (permFlags & permNotes);
1110 }
1111
1112 GBool XRef::okToFillForm(GBool ignoreOwnerPW) {
1113   return (!ignoreOwnerPW && ownerPasswordOk) || (permFlags & permFillForm);
1114 }
1115
1116 GBool XRef::okToAccessibility(GBool ignoreOwnerPW) {
1117   return (!ignoreOwnerPW && ownerPasswordOk) || (permFlags & permAccessibility);
1118 }
1119
1120 GBool XRef::okToAssemble(GBool ignoreOwnerPW) {
1121   return (!ignoreOwnerPW && ownerPasswordOk) || (permFlags & permAssemble);
1122 }
1123
1124 Object *XRef::getCatalog(Object *catalog) {
1125   Object *obj = fetch(rootNum, rootGen, catalog);
1126   if (obj->isDict()) {
1127     return obj;
1128   }
1129   GBool wasReconstructed = false;
1130   GBool ok = constructXRef(&wasReconstructed, gTrue);
1131   return (ok) ? fetch(rootNum, rootGen, catalog) : obj;
1132 }
1133
1134 Object *XRef::fetch(int num, int gen, Object *obj, int recursion) {
1135   XRefEntry *e;
1136   Parser *parser;
1137   Object obj1, obj2, obj3;
1138
1139   xrefLocker();
1140   // check for bogus ref - this can happen in corrupted PDF files
1141   if (num < 0 || num >= size) {
1142     goto err;
1143   }
1144
1145   e = getEntry(num);
1146   if(!e->obj.isNull ()) { //check for updated object
1147     obj = e->obj.copy(obj);
1148     return obj;
1149   }
1150
1151   switch (e->type) {
1152
1153   case xrefEntryUncompressed:
1154     if (e->gen != gen) {
1155       goto err;
1156     }
1157     obj1.initNull();
1158     parser = new Parser(this,
1159                new Lexer(this,
1160                  str->makeSubStream(start + e->offset, gFalse, 0, &obj1)),
1161                gTrue);
1162     parser->getObj(&obj1, recursion);
1163     parser->getObj(&obj2, recursion);
1164     parser->getObj(&obj3, recursion);
1165     if (!obj1.isInt() || obj1.getInt() != num ||
1166         !obj2.isInt() || obj2.getInt() != gen ||
1167         !obj3.isCmd("obj")) {
1168       // some buggy pdf have obj1234 for ints that represent 1234
1169       // try to recover here
1170       if (obj1.isInt() && obj1.getInt() == num &&
1171           obj2.isInt() && obj2.getInt() == gen &&
1172           obj3.isCmd()) {
1173         char *cmd = obj3.getCmd();
1174         if (strlen(cmd) > 3 &&
1175             cmd[0] == 'o' &&
1176             cmd[1] == 'b' &&
1177             cmd[2] == 'j') {
1178           char *end_ptr;
1179           long longNumber = strtol(cmd + 3, &end_ptr, 0);
1180           if (longNumber <= INT_MAX && longNumber >= INT_MIN && *end_ptr == '\0') {
1181             int number = longNumber;
1182             error(errSyntaxWarning, -1, "Cmd was not obj but {0:s}, assuming the creator meant obj {1:d}", cmd, number);
1183             obj->initInt(number);
1184             obj1.free();
1185             obj2.free();
1186             obj3.free();
1187             delete parser;
1188             break;
1189           }
1190         }
1191       }
1192       obj1.free();
1193       obj2.free();
1194       obj3.free();
1195       delete parser;
1196       goto err;
1197     }
1198     parser->getObj(obj, gFalse, (encrypted && !e->getFlag(XRefEntry::Unencrypted)) ? fileKey : NULL,
1199                    encAlgorithm, keyLength, num, gen, recursion);
1200     obj1.free();
1201     obj2.free();
1202     obj3.free();
1203     delete parser;
1204     break;
1205
1206   case xrefEntryCompressed:
1207   {
1208 #if 0 // Adobe apparently ignores the generation number on compressed objects
1209     if (gen != 0) {
1210       goto err;
1211     }
1212 #endif
1213     if (e->offset >= (Guint)size ||
1214         entries[e->offset].type != xrefEntryUncompressed) {
1215       error(errSyntaxError, -1, "Invalid object stream");
1216       goto err;
1217     }
1218
1219     ObjectStream *objStr = NULL;
1220     ObjectStreamKey key(e->offset);
1221     PopplerCacheItem *item = objStrs->lookup(key);
1222     if (item) {
1223       ObjectStreamItem *it = static_cast<ObjectStreamItem *>(item);
1224       objStr = it->objStream;
1225     }
1226
1227     if (!objStr) {
1228       objStr = new ObjectStream(this, e->offset, recursion + 1);
1229       if (!objStr->isOk()) {
1230         delete objStr;
1231         objStr = NULL;
1232         goto err;
1233       } else {
1234         // XRef could be reconstructed in constructor of ObjectStream:
1235         e = getEntry(num);
1236         ObjectStreamKey *newkey = new ObjectStreamKey(e->offset);
1237         ObjectStreamItem *newitem = new ObjectStreamItem(objStr);
1238         objStrs->put(newkey, newitem);
1239       }
1240     }
1241     objStr->getObject(e->gen, num, obj);
1242   }
1243   break;
1244
1245   default:
1246     goto err;
1247   }
1248
1249   return obj;
1250
1251  err:
1252   return obj->initNull();
1253 }
1254
1255 void XRef::lock() {
1256 #if MULTITHREADED
1257   gLockMutex(&mutex);
1258 #endif
1259 }
1260
1261 void XRef::unlock() {
1262 #if MULTITHREADED
1263   gUnlockMutex(&mutex);
1264 #endif
1265 }
1266
1267 Object *XRef::getDocInfo(Object *obj) {
1268   return trailerDict.dictLookup("Info", obj);
1269 }
1270
1271 // Added for the pdftex project.
1272 Object *XRef::getDocInfoNF(Object *obj) {
1273   return trailerDict.dictLookupNF("Info", obj);
1274 }
1275
1276 GBool XRef::getStreamEnd(Goffset streamStart, Goffset *streamEnd) {
1277   int a, b, m;
1278
1279   if (streamEndsLen == 0 ||
1280       streamStart > streamEnds[streamEndsLen - 1]) {
1281     return gFalse;
1282   }
1283
1284   a = -1;
1285   b = streamEndsLen - 1;
1286   // invariant: streamEnds[a] < streamStart <= streamEnds[b]
1287   while (b - a > 1) {
1288     m = (a + b) / 2;
1289     if (streamStart <= streamEnds[m]) {
1290       b = m;
1291     } else {
1292       a = m;
1293     }
1294   }
1295   *streamEnd = streamEnds[b];
1296   return gTrue;
1297 }
1298
1299 int XRef::getNumEntry(Goffset offset)
1300 {
1301   if (size > 0)
1302   {
1303     int res = 0;
1304     Goffset resOffset = getEntry(0)->offset;
1305     XRefEntry *e;
1306     for (int i = 1; i < size; ++i)
1307     {
1308       e = getEntry(i, gFalse);
1309       if (e->type != xrefEntryFree && e->offset < offset && e->offset >= resOffset)
1310       {
1311         res = i;
1312         resOffset = e->offset;
1313       }
1314     }
1315     return res;
1316   }
1317   else return -1;
1318 }
1319
1320 void XRef::add(int num, int gen, Goffset offs, GBool used) {
1321   xrefLocker();
1322   if (num >= size) {
1323     if (num >= capacity) {
1324       entries = (XRefEntry *)greallocn(entries, num + 1, sizeof(XRefEntry));
1325       capacity = num + 1;
1326     }
1327     for (int i = size; i < num + 1; ++i) {
1328       entries[i].offset = -1;
1329       entries[i].type = xrefEntryFree;
1330       entries[i].obj.initNull ();
1331       entries[i].flags = 0;
1332       entries[i].gen = 0;
1333     }
1334     size = num + 1;
1335   }
1336   XRefEntry *e = getEntry(num);
1337   e->gen = gen;
1338   e->obj.initNull ();
1339   e->flags = 0;
1340   if (used) {
1341     e->type = xrefEntryUncompressed;
1342     e->offset = offs;
1343   } else {
1344     e->type = xrefEntryFree;
1345     e->offset = 0;
1346   }
1347 }
1348
1349 void XRef::setModifiedObject (Object* o, Ref r) {
1350   xrefLocker();
1351   if (r.num < 0 || r.num >= size) {
1352     error(errInternal, -1,"XRef::setModifiedObject on unknown ref: {0:d}, {1:d}\n", r.num, r.gen);
1353     return;
1354   }
1355   XRefEntry *e = getEntry(r.num);
1356   e->obj.free();
1357   o->copy(&(e->obj));
1358   e->setFlag(XRefEntry::Updated, gTrue);
1359 }
1360
1361 Ref XRef::addIndirectObject (Object* o) {
1362   int entryIndexToUse = -1;
1363   for (int i = 1; entryIndexToUse == -1 && i < size; ++i) {
1364     XRefEntry *e = getEntry(i, false /* complainIfMissing */);
1365     if (e->type == xrefEntryFree && e->gen != 65535) {
1366       entryIndexToUse = i;
1367     }
1368   }
1369
1370   XRefEntry *e;
1371   if (entryIndexToUse == -1) {
1372     entryIndexToUse = size;
1373     add(entryIndexToUse, 0, 0, gFalse);
1374     e = getEntry(entryIndexToUse);
1375   } else {
1376     //reuse a free entry
1377     e = getEntry(entryIndexToUse);
1378     //we don't touch gen number, because it should have been
1379     //incremented when the object was deleted
1380   }
1381   e->type = xrefEntryUncompressed;
1382   o->copy(&e->obj);
1383   e->setFlag(XRefEntry::Updated, gTrue);
1384
1385   Ref r;
1386   r.num = entryIndexToUse;
1387   r.gen = e->gen;
1388   return r;
1389 }
1390
1391 void XRef::removeIndirectObject(Ref r) {
1392   xrefLocker();
1393   if (r.num < 0 || r.num >= size) {
1394     error(errInternal, -1,"XRef::removeIndirectObject on unknown ref: {0:d}, {1:d}\n", r.num, r.gen);
1395     return;
1396   }
1397   XRefEntry *e = getEntry(r.num);
1398   if (e->type == xrefEntryFree) {
1399     return;
1400   }
1401   e->obj.free();
1402   e->type = xrefEntryFree;
1403   e->gen++;
1404   e->setFlag(XRefEntry::Updated, gTrue);
1405 }
1406
1407 void XRef::writeXRef(XRef::XRefWriter *writer, GBool writeAllEntries) {
1408   //create free entries linked-list
1409   if (getEntry(0)->gen != 65535) {
1410     error(errInternal, -1, "XRef::writeXRef, entry 0 of the XRef is invalid (gen != 65535)\n");
1411   }
1412   int lastFreeEntry = 0;
1413   for (int i=0; i<size; i++) {
1414     if (getEntry(i)->type == xrefEntryFree) {
1415       getEntry(lastFreeEntry)->offset = i;
1416       lastFreeEntry = i;
1417     }
1418   }
1419   getEntry(lastFreeEntry)->offset = 0;
1420
1421   if (writeAllEntries) {
1422     writer->startSection(0, size);
1423     for (int i=0; i<size; i++) {
1424       XRefEntry *e = getEntry(i);
1425       if(e->gen > 65535) e->gen = 65535; //cap generation number to 65535 (required by PDFReference)
1426       writer->writeEntry(e->offset, e->gen, e->type);
1427     }
1428   } else {
1429     int i = 0;
1430     while (i < size) {
1431       int j;
1432       for(j=i; j<size; j++) { //look for consecutive entries
1433         if ((getEntry(j)->type == xrefEntryFree) && (getEntry(j)->gen == 0))
1434           break;
1435       }
1436       if (j-i != 0)
1437       {
1438         writer->startSection(i, j-i);
1439         for (int k=i; k<j; k++) {
1440           XRefEntry *e = getEntry(k);
1441           if(e->gen > 65535) e->gen = 65535; //cap generation number to 65535 (required by PDFReference)
1442           writer->writeEntry(e->offset, e->gen, e->type);
1443         }
1444         i = j;
1445       }
1446       else ++i;
1447     }
1448   }
1449 }
1450
1451 XRef::XRefTableWriter::XRefTableWriter(OutStream* outStrA) {
1452   outStr = outStrA;
1453 }
1454
1455 void XRef::XRefTableWriter::startSection(int first, int count) {
1456   outStr->printf("%i %i\r\n", first, count);
1457 }
1458
1459 void XRef::XRefTableWriter::writeEntry(Goffset offset, int gen, XRefEntryType type) {
1460   outStr->printf("%010lli %05i %c\r\n", (long long)offset, gen, (type==xrefEntryFree)?'f':'n');
1461 }
1462
1463 void XRef::writeTableToFile(OutStream* outStr, GBool writeAllEntries) {
1464   XRefTableWriter writer(outStr);
1465   outStr->printf("xref\r\n");
1466   writeXRef(&writer, writeAllEntries);
1467 }
1468
1469 XRef::XRefStreamWriter::XRefStreamWriter(Object *indexA, GooString *stmBufA, int offsetSizeA) {
1470   index = indexA;
1471   stmBuf = stmBufA;
1472   offsetSize = offsetSizeA;
1473 }
1474
1475 void XRef::XRefStreamWriter::startSection(int first, int count) {
1476   Object obj;
1477   index->arrayAdd( obj.initInt(first) );
1478   index->arrayAdd( obj.initInt(count) );
1479 }
1480
1481 void XRef::XRefStreamWriter::writeEntry(Goffset offset, int gen, XRefEntryType type) {
1482   const int entryTotalSize = 1 + offsetSize + 2; /* type + offset + gen */
1483   char data[16];
1484   data[0] = (type==xrefEntryFree) ? 0 : 1;
1485   for (int i = offsetSize; i > 0; i--) {
1486     data[i] = offset & 0xff;
1487     offset >>= 8;
1488   }
1489   data[offsetSize + 1] = (gen >> 8) & 0xff;
1490   data[offsetSize + 2] = gen & 0xff;
1491   stmBuf->append(data, entryTotalSize);
1492 }
1493
1494 XRef::XRefPreScanWriter::XRefPreScanWriter() {
1495   hasOffsetsBeyond4GB = gFalse;
1496 }
1497
1498 void XRef::XRefPreScanWriter::startSection(int first, int count) {
1499 }
1500
1501 void XRef::XRefPreScanWriter::writeEntry(Goffset offset, int gen, XRefEntryType type) {
1502   if (offset >= 0x100000000ll)
1503     hasOffsetsBeyond4GB = gTrue;
1504 }
1505
1506 void XRef::writeStreamToBuffer(GooString *stmBuf, Dict *xrefDict, XRef *xref) {
1507   Object index;
1508   index.initArray(xref);
1509   stmBuf->clear();
1510
1511   // First pass: determine whether all offsets fit in 4 bytes or not
1512   XRefPreScanWriter prescan;
1513   writeXRef(&prescan, gFalse);
1514   const int offsetSize = prescan.hasOffsetsBeyond4GB ? sizeof(Goffset) : 4;
1515
1516   // Second pass: actually write the xref stream
1517   XRefStreamWriter writer(&index, stmBuf, offsetSize);
1518   writeXRef(&writer, gFalse);
1519
1520   Object obj1, obj2;
1521   xrefDict->set("Type", obj1.initName("XRef"));
1522   xrefDict->set("Index", &index);
1523   obj2.initArray(xref);
1524   obj2.arrayAdd( obj1.initInt(1) );
1525   obj2.arrayAdd( obj1.initInt(offsetSize) );
1526   obj2.arrayAdd( obj1.initInt(2) );
1527   xrefDict->set("W", &obj2);
1528 }
1529
1530 GBool XRef::parseEntry(Goffset offset, XRefEntry *entry)
1531 {
1532   GBool r;
1533
1534   Object obj;
1535   obj.initNull();
1536   Parser parser = Parser(NULL, new Lexer(NULL,
1537      str->makeSubStream(offset, gFalse, 20, &obj)), gTrue);
1538
1539   Object obj1, obj2, obj3;
1540   if (((parser.getObj(&obj1)->isInt()) ||
1541        parser.getObj(&obj1)->isInt64()) &&
1542       (parser.getObj(&obj2)->isInt()) &&
1543       (parser.getObj(&obj3)->isCmd("n") || obj3.isCmd("f"))) {
1544     if (obj1.isInt64())
1545       entry->offset = obj1.getInt64();
1546     else
1547       entry->offset = obj1.getInt();
1548     entry->gen = obj2.getInt();
1549     entry->type = obj3.isCmd("n") ? xrefEntryUncompressed : xrefEntryFree;
1550     entry->obj.initNull ();
1551     entry->flags = 0;
1552     r = gTrue;
1553   } else {
1554     r = gFalse;
1555   }
1556   obj1.free();
1557   obj2.free();
1558   obj3.free();
1559
1560   return r;
1561 }
1562
1563 /* Traverse all XRef tables and, if untilEntryNum != -1, stop as soon as
1564  * untilEntryNum is found, or try to reconstruct the xref table if it's not
1565  * present in any xref.
1566  * If xrefStreamObjsNum is not NULL, it is filled with the list of the object
1567  * numbers of the XRef streams that have been traversed */
1568 void XRef::readXRefUntil(int untilEntryNum, std::vector<int> *xrefStreamObjsNum)
1569 {
1570   std::vector<Goffset> followedPrev;
1571   while (prevXRefOffset && (untilEntryNum == -1 || (untilEntryNum < size && entries[untilEntryNum].type == xrefEntryNone))) {
1572     bool followed = false;
1573     for (size_t j = 0; j < followedPrev.size(); j++) {
1574       if (followedPrev.at(j) == prevXRefOffset) {
1575         followed = true;
1576         break;
1577       }
1578     }
1579     if (followed) {
1580       error(errSyntaxError, -1, "Circular XRef");
1581       if (!(ok = constructXRef(NULL))) {
1582         errCode = errDamaged;
1583       }
1584       break;
1585     }
1586
1587     followedPrev.push_back (prevXRefOffset);
1588
1589     std::vector<Goffset> followedXRefStm;
1590     if (!readXRef(&prevXRefOffset, &followedXRefStm, xrefStreamObjsNum)) {
1591         prevXRefOffset = 0;
1592     }
1593
1594     // if there was a problem with the xref table, or we haven't found the entry
1595     // we were looking for, try to reconstruct the xref
1596     if (!ok || (!prevXRefOffset && untilEntryNum != -1 && entries[untilEntryNum].type == xrefEntryNone)) {
1597         GBool wasReconstructed = false;
1598         if (!(ok = constructXRef(&wasReconstructed))) {
1599             errCode = errDamaged;
1600             break;
1601         }
1602         break;
1603     }
1604   }
1605 }
1606
1607 XRefEntry *XRef::getEntry(int i, GBool complainIfMissing)
1608 {
1609   if (i >= size || entries[i].type == xrefEntryNone) {
1610
1611     if ((!xRefStream) && mainXRefEntriesOffset) {
1612       if (!parseEntry(mainXRefEntriesOffset + 20*i, &entries[i])) {
1613         error(errSyntaxError, -1, "Failed to parse XRef entry [{0:d}].", i);
1614       }
1615     } else {
1616       // Read XRef tables until the entry we're looking for is found
1617       readXRefUntil(i);
1618
1619       // We might have reconstructed the xref
1620       // Check again i is in bounds
1621       if (unlikely(i >= size)) {
1622         static XRefEntry dummy;
1623         dummy.offset = 0;
1624         dummy.gen = -1;
1625         dummy.type = xrefEntryNone;
1626         dummy.flags = 0;
1627         return &dummy;
1628       }
1629
1630       if (entries[i].type == xrefEntryNone) {
1631         if (complainIfMissing) {
1632           error(errSyntaxError, -1, "Invalid XRef entry");
1633         }
1634         entries[i].type = xrefEntryFree;
1635       }
1636     }
1637   }
1638
1639   return &entries[i];
1640 }
1641
1642 // Recursively sets the Unencrypted flag in all referenced xref entries
1643 void XRef::markUnencrypted(Object *obj) {
1644   Object obj1;
1645
1646   switch (obj->getType()) {
1647     case objArray:
1648     {
1649       Array *array = obj->getArray();
1650       for (int i = 0; i < array->getLength(); i++) {
1651         markUnencrypted(array->getNF(i, &obj1));
1652         obj1.free();
1653       }
1654       break;
1655     }
1656     case objStream:
1657     case objDict:
1658     {
1659       Dict *dict;
1660       if (obj->getType() == objStream) {
1661         Stream *stream = obj->getStream();
1662         dict = stream->getDict();
1663       } else {
1664         dict = obj->getDict();
1665       }
1666       for (int i = 0; i < dict->getLength(); i++) {
1667         markUnencrypted(dict->getValNF(i, &obj1));
1668         obj1.free();
1669       }
1670       break;
1671     }
1672     case objRef:
1673     {
1674       Ref ref = obj->getRef();
1675       XRefEntry *e = getEntry(ref.num);
1676       if (e->getFlag(XRefEntry::Unencrypted))
1677         return; // We've already been here: prevent infinite recursion
1678       e->setFlag(XRefEntry::Unencrypted, gTrue);
1679       fetch(ref.num, ref.gen, &obj1);
1680       markUnencrypted(&obj1);
1681       obj1.free();
1682       break;
1683     }
1684     default:
1685       break;
1686   }
1687 }
1688
1689 void XRef::scanSpecialFlags() {
1690   if (scannedSpecialFlags) {
1691     return;
1692   }
1693   scannedSpecialFlags = gTrue;
1694
1695   // "Rewind" the XRef linked list, so that readXRefUntil re-reads all XRef
1696   // tables/streams, even those that had already been parsed
1697   prevXRefOffset = mainXRefOffset;
1698
1699   std::vector<int> xrefStreamObjNums;
1700   if (!streamEndsLen) { // don't do it for already reconstructed xref
1701     readXRefUntil(-1 /* read all xref sections */, &xrefStreamObjNums);
1702   }
1703
1704   // Mark object streams as DontRewrite, because we write each object
1705   // individually in full rewrite mode.
1706   for (int i = 0; i < size; ++i) {
1707     if (entries[i].type == xrefEntryCompressed) {
1708       const int objStmNum = entries[i].offset;
1709       if (unlikely(objStmNum < 0 || objStmNum >= size)) {
1710         error(errSyntaxError, -1, "Compressed object offset out of xref bounds");
1711       } else {
1712         getEntry(objStmNum)->setFlag(XRefEntry::DontRewrite, gTrue);
1713       }
1714     }
1715   }
1716
1717   // Mark XRef streams objects as Unencrypted and DontRewrite
1718   for (size_t i = 0; i < xrefStreamObjNums.size(); ++i) {
1719     const int objNum = xrefStreamObjNums.at(i);
1720     getEntry(objNum)->setFlag(XRefEntry::Unencrypted, gTrue);
1721     getEntry(objNum)->setFlag(XRefEntry::DontRewrite, gTrue);
1722   }
1723
1724   // Mark objects referred from the Encrypt dict as Unencrypted
1725   Object obj;
1726   markUnencrypted(trailerDict.dictLookupNF("Encrypt", &obj));
1727   obj.free();
1728 }
1729
1730 void XRef::markUnencrypted() {
1731   // Mark objects referred from the Encrypt dict as Unencrypted
1732   Object obj;
1733   trailerDict.dictLookupNF("Encrypt", &obj);
1734   if (obj.isRef()) {
1735     XRefEntry *e = getEntry(obj.getRefNum());
1736     e->setFlag(XRefEntry::Unencrypted, gTrue);
1737   }
1738   obj.free();
1739 }
1740