projects/mde: mde/mergetag/read.d annotate

annotate mde/mergetag/read.d @ 3:485c98ecbd91

text.parse: fixed a small bug with char[]'s. committer: Diggory Hardy <diggory.hardy@gmail.com>

author	Diggory Hardy <diggory.hardy@gmail.com>
date	Sat, 03 Nov 2007 16:06:06 +0000
parents	78eb491bd642
children	9a990644948c

rev	line source
0 d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	1 /**************************************************************************************************
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	2 * This module contains all reading functions, for both binary and text MergeTag files.
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	3 *
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	4 * It publically imports mde.mergetag.dataset.
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	5 *************************************************************************************************/
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	6
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	7 module mde.mergetag.read;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	8
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	9 // package imports
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	10 public import mde.mergetag.dataset;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	11 import mde.mergetag.exception;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	12
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	13 // tango imports
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	14 import tango.io.UnicodeFile;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	15 import Util = tango.text.Util;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	16 import ConvInt = tango.text.convert.Integer;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	17 import tango.util.collection.model.View : View;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	18 import tango.util.collection.ArrayBag : ArrayBag;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	19 import tango.util.log.Log : Log, Logger;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	20
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	21 // TODO: allow compressing with zlib for both binary and text? (.mtz, .mtt, .mtb extensions)
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	22
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	23 // For now, all section & data tag IDs are uints.
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	24 // TODO: allow a lookup table or function to find a uint ID from a string ID
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	25
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	26 /**
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	27 * Class for reading a file.
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	28 *
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	29 * Use as:
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	30 * -----------------------
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	31 * Reader foo("foo.mtt");
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	32 * foo.read();
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	33 * // get your data from foo.dataset.
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	34 * -----------------------
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	35 */
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	36 class Reader
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	37 {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	38 //BEGIN DATA
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	39 /**
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	40 A container for all read data.
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	41
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	42 This may be accessed from here; however it may be preferable to use an external reference
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	43 (passed to the class on initialisation).
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	44 */
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	45 DataSet dataset;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	46
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	47 /** A table, which if created, allows items in a text file to have a string ID.
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	48 *
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	49 * If a string ID is given for a section or tag identifier and that string is a key in this
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	50 * table, then the corresponding ID type is used (if the string is not found an error is thrown).
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	51 */
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	52 ID[char[]] indexTable; // see setIndexLookupTable() doc for use.
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	53
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	54 /** A function for creating new DataSections within the dataset.
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	55 *
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	56 * Allows a user-made class to be used in the DataSet instead of DefaultData.
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	57 *
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	58 * This works by supplying a function which returns a reference to an instance of a class
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	59 * implementing DataSection. The function is passed the ID of the new section and may use this
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	60 * to use different DataSection classes for different sections.
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	61 */
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	62 DataSection function (ID) dataSecCreator = null;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	63
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	64 private:
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	65 // Static symbols:
2 78eb491bd642 mergetag: partially redesigned dataset and text reader classes. Changed text format. Diggory Hardy <diggory.hardy@gmail.com> parents: 1 diff changeset	66 typedef void delegate (TypeInfo,ID,char[]) readDelg; // Delegate for accepting tags.
0 d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	67
2 78eb491bd642 mergetag: partially redesigned dataset and text reader classes. Changed text format. Diggory Hardy <diggory.hardy@gmail.com> parents: 1 diff changeset	68 static bool initialised = false;
78eb491bd642 mergetag: partially redesigned dataset and text reader classes. Changed text format. Diggory Hardy <diggory.hardy@gmail.com> parents: 1 diff changeset	69 static TypeInfo[char[]] typeTable;
0 d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	70 static Logger logger;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	71
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	72 // Error messages as const variables. Could be loaded from files to support other languages?
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	73 static const char[] ERR_FILEREAD = "Error reading file: ";
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	74 static const char[] ERR_MTHEAD = "Not a valid MergeTag text file";
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	75 static const char[] ERR_MTVER = "Unrecognised MergeTag version: MT";
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	76 static const char[] ERR_EOF = "Unexpected EOF";
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	77 static const char[] ERR_STAG = "Bad section tag format: not {id}";
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	78 static const char[] ERR_DTAG = "Bad data tag format: not <type\|id=data>";
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	79 static const char[] ERR_CHAR = "Invalid character (or sequence starting \"!\") outside of tag";
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	80 static const char[] ERR_IDINT = "Tag has invalid integer ID: not a valid uint value";
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	81
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	82 // Non-static symbols:
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	83 final char[] ErrInFile; // something like "in \"path/file.mtt\""
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	84
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	85 final char[] fbuf; // file is read into this
1 18491334a525 Finished format.d and parse.d modules; moved to mde/text. Partway implementing mde.mergetag.write.TextWriter. Diggory Hardy <diggory.hardy@gmail.com> parents: 0 diff changeset	86 MTFormatVersion.VERS fileVer = MTFormatVersion.VERS.INVALID; // Remains INVALID until set otherwise by CTOR.
0 d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	87
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	88 uint endOfHeader;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	89 bool allRead = false; // true if endOfHeader == fbuf.length or read([]) has run
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	90 bool fatal = false; // a fatal file error occured; don't try to recover
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	91 /* If the file is scanned for sections, the starting position of all sections are stored
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	92 * in secTable. If this is empty, either no sections exist (and endOfHeader == fbuf.length)
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	93 * or a section scan has not been run (read() with no section names doesn't need to do so).
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	94 */
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	95 struct SecMD { // sec meta data
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	96 static SecMD opCall (uint _pos, bool _read) {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	97 SecMD ret;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	98 ret.pos = _pos;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	99 ret.read = _read;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	100 return ret;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	101 }
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	102 uint pos; // position to start reading
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	103 bool read; // true if already read
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	104 }
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	105 SecMD [ID] secTable;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	106 //END DATA
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	107
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	108 //BEGIN METHODS: CTOR / DTOR
2 78eb491bd642 mergetag: partially redesigned dataset and text reader classes. Changed text format. Diggory Hardy <diggory.hardy@gmail.com> parents: 1 diff changeset	109 // Could be a static this(), but this way it's only called if the class is used.
78eb491bd642 mergetag: partially redesigned dataset and text reader classes. Changed text format. Diggory Hardy <diggory.hardy@gmail.com> parents: 1 diff changeset	110 private void init () {
78eb491bd642 mergetag: partially redesigned dataset and text reader classes. Changed text format. Diggory Hardy <diggory.hardy@gmail.com> parents: 1 diff changeset	111 init_addType!(bool);
78eb491bd642 mergetag: partially redesigned dataset and text reader classes. Changed text format. Diggory Hardy <diggory.hardy@gmail.com> parents: 1 diff changeset	112 init_addType!(byte);
78eb491bd642 mergetag: partially redesigned dataset and text reader classes. Changed text format. Diggory Hardy <diggory.hardy@gmail.com> parents: 1 diff changeset	113 init_addType!(short);
78eb491bd642 mergetag: partially redesigned dataset and text reader classes. Changed text format. Diggory Hardy <diggory.hardy@gmail.com> parents: 1 diff changeset	114 init_addType!(int);
78eb491bd642 mergetag: partially redesigned dataset and text reader classes. Changed text format. Diggory Hardy <diggory.hardy@gmail.com> parents: 1 diff changeset	115 init_addType!(long);
78eb491bd642 mergetag: partially redesigned dataset and text reader classes. Changed text format. Diggory Hardy <diggory.hardy@gmail.com> parents: 1 diff changeset	116 init_addType!(ubyte);
78eb491bd642 mergetag: partially redesigned dataset and text reader classes. Changed text format. Diggory Hardy <diggory.hardy@gmail.com> parents: 1 diff changeset	117 init_addType!(ushort);
78eb491bd642 mergetag: partially redesigned dataset and text reader classes. Changed text format. Diggory Hardy <diggory.hardy@gmail.com> parents: 1 diff changeset	118 init_addType!(uint);
78eb491bd642 mergetag: partially redesigned dataset and text reader classes. Changed text format. Diggory Hardy <diggory.hardy@gmail.com> parents: 1 diff changeset	119 init_addType!(ulong);
78eb491bd642 mergetag: partially redesigned dataset and text reader classes. Changed text format. Diggory Hardy <diggory.hardy@gmail.com> parents: 1 diff changeset	120 init_addType!(char);
78eb491bd642 mergetag: partially redesigned dataset and text reader classes. Changed text format. Diggory Hardy <diggory.hardy@gmail.com> parents: 1 diff changeset	121 init_addType!(float);
78eb491bd642 mergetag: partially redesigned dataset and text reader classes. Changed text format. Diggory Hardy <diggory.hardy@gmail.com> parents: 1 diff changeset	122 init_addType!(double);
78eb491bd642 mergetag: partially redesigned dataset and text reader classes. Changed text format. Diggory Hardy <diggory.hardy@gmail.com> parents: 1 diff changeset	123 init_addType!(real);
78eb491bd642 mergetag: partially redesigned dataset and text reader classes. Changed text format. Diggory Hardy <diggory.hardy@gmail.com> parents: 1 diff changeset	124 init_addType!(bool[]);
78eb491bd642 mergetag: partially redesigned dataset and text reader classes. Changed text format. Diggory Hardy <diggory.hardy@gmail.com> parents: 1 diff changeset	125 init_addType!(byte[]);
78eb491bd642 mergetag: partially redesigned dataset and text reader classes. Changed text format. Diggory Hardy <diggory.hardy@gmail.com> parents: 1 diff changeset	126 init_addType!(short[]);
78eb491bd642 mergetag: partially redesigned dataset and text reader classes. Changed text format. Diggory Hardy <diggory.hardy@gmail.com> parents: 1 diff changeset	127 init_addType!(int[]);
78eb491bd642 mergetag: partially redesigned dataset and text reader classes. Changed text format. Diggory Hardy <diggory.hardy@gmail.com> parents: 1 diff changeset	128 init_addType!(long[]);
78eb491bd642 mergetag: partially redesigned dataset and text reader classes. Changed text format. Diggory Hardy <diggory.hardy@gmail.com> parents: 1 diff changeset	129 init_addType!(ubyte[]);
78eb491bd642 mergetag: partially redesigned dataset and text reader classes. Changed text format. Diggory Hardy <diggory.hardy@gmail.com> parents: 1 diff changeset	130 init_addType!(ushort[]);
78eb491bd642 mergetag: partially redesigned dataset and text reader classes. Changed text format. Diggory Hardy <diggory.hardy@gmail.com> parents: 1 diff changeset	131 init_addType!(uint[]);
78eb491bd642 mergetag: partially redesigned dataset and text reader classes. Changed text format. Diggory Hardy <diggory.hardy@gmail.com> parents: 1 diff changeset	132 init_addType!(ulong[]);
78eb491bd642 mergetag: partially redesigned dataset and text reader classes. Changed text format. Diggory Hardy <diggory.hardy@gmail.com> parents: 1 diff changeset	133 init_addType!(char[]);
78eb491bd642 mergetag: partially redesigned dataset and text reader classes. Changed text format. Diggory Hardy <diggory.hardy@gmail.com> parents: 1 diff changeset	134 init_addType!(float[]);
78eb491bd642 mergetag: partially redesigned dataset and text reader classes. Changed text format. Diggory Hardy <diggory.hardy@gmail.com> parents: 1 diff changeset	135 init_addType!(double[]);
78eb491bd642 mergetag: partially redesigned dataset and text reader classes. Changed text format. Diggory Hardy <diggory.hardy@gmail.com> parents: 1 diff changeset	136 init_addType!(real[]);
78eb491bd642 mergetag: partially redesigned dataset and text reader classes. Changed text format. Diggory Hardy <diggory.hardy@gmail.com> parents: 1 diff changeset	137 // aliases:
78eb491bd642 mergetag: partially redesigned dataset and text reader classes. Changed text format. Diggory Hardy <diggory.hardy@gmail.com> parents: 1 diff changeset	138 typeTable["string"] = typeid(char[]);
78eb491bd642 mergetag: partially redesigned dataset and text reader classes. Changed text format. Diggory Hardy <diggory.hardy@gmail.com> parents: 1 diff changeset	139 typeTable["binary"] = typeid(ubyte[]);
78eb491bd642 mergetag: partially redesigned dataset and text reader classes. Changed text format. Diggory Hardy <diggory.hardy@gmail.com> parents: 1 diff changeset	140
0 d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	141 logger = Log.getLogger ("mde.mergetag.read.Reader");
2 78eb491bd642 mergetag: partially redesigned dataset and text reader classes. Changed text format. Diggory Hardy <diggory.hardy@gmail.com> parents: 1 diff changeset	142 initialised = true;
78eb491bd642 mergetag: partially redesigned dataset and text reader classes. Changed text format. Diggory Hardy <diggory.hardy@gmail.com> parents: 1 diff changeset	143 }
78eb491bd642 mergetag: partially redesigned dataset and text reader classes. Changed text format. Diggory Hardy <diggory.hardy@gmail.com> parents: 1 diff changeset	144 private static void init_addType(T) () {
78eb491bd642 mergetag: partially redesigned dataset and text reader classes. Changed text format. Diggory Hardy <diggory.hardy@gmail.com> parents: 1 diff changeset	145 typeTable[T.stringof] = typeid(T);
0 d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	146 }
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	147
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	148 /** Tries to open file path and read it into a buffer.
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	149 *
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	150 * Params:
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	151 * path = The name or FilePath of the file to open.
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	152 * Standard extensions are .mtt and .mtb for text and binary files respectively.
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	153 * dataset_ = If null create a new DataSet, else use existing DataSet *dataset_ and merge read
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	154 * data into it.
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	155 * rdHeader = If true, read the header like a standard section. Doesn't read the header by
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	156 * default since if it's not requested it's likely not wanted.
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	157 *
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	158 * Memory:
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	159 * This currently works by loading the whole file into memory at once. This should be fine most
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	160 * of the time, but could potentially be a problem. Changing this would mean significantly
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	161 * changes to the way the code works.
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	162 */
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	163 /* Ideas for implementing a partial-loading memory model:
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	164 * Use a conduit directly.
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	165 * Use a fiber to do the parsing; let it switch back when it runs out of memory.
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	166 * Redesign the code so it never needs to look backwards in the buffer?
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	167 *
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	168 * Major problem: reading only some sections and keeping references to other sections
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	169 * would no longer be possible.
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	170 */
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	171 public this (char[] path, DataSet* dataset_ = null, bool rdHeader = false) {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	172 this (new FilePath (path), dataset_, rdHeader);
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	173 }
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	174 /** ditto */
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	175 public this (PathView path, DataSet* dataset_ = null, bool rdHeader = false) {
2 78eb491bd642 mergetag: partially redesigned dataset and text reader classes. Changed text format. Diggory Hardy <diggory.hardy@gmail.com> parents: 1 diff changeset	176 if (!initialised) init(); // on-demand static this()
78eb491bd642 mergetag: partially redesigned dataset and text reader classes. Changed text format. Diggory Hardy <diggory.hardy@gmail.com> parents: 1 diff changeset	177
0 d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	178 // Create a dataset or use an existing one
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	179 if (dataset_) dataset = *dataset_;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	180 else dataset = new DataSet();
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	181
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	182 // Open & read the file
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	183 try { // Supports unicode files with a BOM; defaults to UTF8 when there isn't a BOM:
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	184 scope file = new UnicodeFile!(char) (path, Encoding.Unknown);
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	185 fbuf = cast(char[]) file.read();
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	186 } catch (Exception e) {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	187 throwMTErr (ERR_FILEREAD ~ e.msg, new MTFileIOException);
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	188 }
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	189 // Remember the file name so that we can report errors (somewhat) informatively:
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	190 ErrInFile = " in \"" ~ path.path ~ path.file ~ '"';
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	191
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	192 // Version checking & matching header section tag:
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	193 if (fbuf.length < 6 \|\| fbuf[0] != '{' \|\| fbuf[1] != 'M' \|\| fbuf[2] != 'T' \|\| fbuf[5] != '}')
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	194 throwMTErr(ERR_MTHEAD ~ ErrInFile, new MTFileFormatException);
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	195 fileVer = MTFormatVersion.parseString (fbuf[3..5]);
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	196 if (fileVer == MTFormatVersion.VERS.INVALID)
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	197 throwMTErr(ERR_MTVER ~ fbuf[3..5] ~ ErrInFile, new MTFileFormatException);
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	198
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	199 // Header reading/skipping:
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	200 if (rdHeader) { // only bother actually reading it if it was requested
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	201 dataset.header = new DefaultData;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	202 endOfHeader = parseSection (6,&dataset.header.addTag);
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	203 }
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	204 else endOfHeader = parseSection (6,null);
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	205 }
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	206 // Was intended to close file, but file is closed within CTOR anyway.
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	207 public ~this () {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	208 }
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	209 //END METHODS: CTOR / DTOR
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	210
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	211 //BEGIN METHODS: PUBLIC
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	212 /// Scans for sections if not already done and returns a list of IDs.
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	213 public uint[] getSectionNames () {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	214 if (fatal) return [];
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	215 if (!secTable.length)
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	216 for (uint pos = endOfHeader; pos < fbuf.length;) {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	217 try {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	218 ID id = fbufReadSecMarker (pos);
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	219 secTable[id] = SecMD(pos,false); // add to table
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	220 } catch (MTStringIDException) {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	221 // ignore section; this happens anyway (but don't add to table)
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	222 }
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	223 pos = parseSection (pos, null);
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	224 }
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	225 return cast(uint[]) secTable.keys;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	226 }
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	227
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	228 /** Reads (some) sections of the file into data. Note that sections will never be _read twice.
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	229 *
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	230 * To be more accurate, the file is copied into a buffer by this(). read() then parses the
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	231 * contents of this buffer, and stores the contents in dataset.
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	232 *
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	233 * Each section read is stored in a DataSection class. By default this is an instance of
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	234 * DefaultData; this can be customised (see setDataSectionCreator).
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	235 *
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	236 * If secSet is non-empty, reading is restricted to sections given in secSet, otherwise all
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	237 * sections are read. Sections given in secSet but not found in the file are not reported as an
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	238 * error. Suggested: supply a HashSet!(uint) as the View!(ID). An ArrayBag!(ID) as used is not a
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	239 * good choice, except that in this case it's empty.
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	240 *
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	241 * Merging:
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	242 * Where a section already exists in the DataSet (when either the section is given more than
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	243 * once in the file, or it was read from a different file by another reader) it is merged.
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	244 * Entries already in the DataSet take priority.
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	245 *
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	246 * Performance:
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	247 * Note that loading only desired sections like this still parses the sections not
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	248 * read (although it does not try to understand the type or data fields), so there is only a
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	249 * small performance advantage to this where other sections do exist in the file. There is also
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	250 * some overhead in only partially reading the file to keep track of where other sections are so
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	251 * that the entire file need not be re-read if further (or all remaining) sections are read
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	252 * later.
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	253 */
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	254 public void read (View!(ID) secSet = new ArrayBag!(ID)) {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	255 if (allRead \|\| fatal) return; // never do anything in either case
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	256 if (secSet.size) {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	257 if (secTable.length) {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	258 foreach (ID id; secSet) {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	259 SecMD* psmd = id in secTable;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	260 if (psmd && !psmd.read) { // may not exist
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	261 DataSection ds = getOrCreateSec (id);
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	262 parseSection (psmd.pos, &ds.addTag);
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	263 psmd.read = true;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	264 }
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	265 }
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	266 } else {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	267 for (uint pos = endOfHeader; pos < fbuf.length;) {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	268 try {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	269 ID id = fbufReadSecMarker (pos);
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	270 secTable[id] = SecMD(pos,false); // add to table
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	271 if (secSet.contains(id)) {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	272 DataSection ds = getOrCreateSec (id);
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	273 pos = parseSection (pos, &ds.addTag);
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	274 secTable[id].read = true;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	275 }
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	276 } catch (MTStringIDException) { // don't do any of the stuff above
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	277 pos = parseSection (pos, null); // and skip the section
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	278 }
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	279 }
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	280 }
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	281 } else {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	282 if (secTable.length) {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	283 foreach (ID id, ref SecMD smd; secTable) {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	284 if (!smd.read) {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	285 DataSection ds = getOrCreateSec (id);
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	286 parseSection (smd.pos, &ds.addTag);
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	287 smd.read = true;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	288 }
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	289 }
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	290 } else { // this time we don't need to use secTable
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	291 for (uint pos = endOfHeader; pos < fbuf.length;) {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	292 try {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	293 ID id = fbufReadSecMarker (pos);
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	294 DataSection ds = getOrCreateSec (id);
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	295 pos = parseSection (pos, &ds.addTag);
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	296 } catch (MTStringIDException) {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	297 pos = parseSection (pos, null); // just skip the section
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	298 }
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	299 }
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	300 }
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	301 allRead = true;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	302 }
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	303 }
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	304 //END METHODS: PUBLIC
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	305
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	306 //BEGIN METHODS: PRIVATE
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	307 /* Reads a section, starting from index pos, finishing at the next section marker (returning
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	308 the position of the start of the marker). pos should start after the section marker.
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	309
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	310 After analysing tags, the function passes the type, ID (possibly converted) and data to addTag.
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	311
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	312 NOTE: from performance tests on indexing char[]'s and dereferencing char's, the char's are
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	313 slightly faster, but a tiny difference isn't worth the extra effort/risk of using char*'s.
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	314 */
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	315 private uint parseSection (uint pos, readDelg addTag) {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	316 bool comment = false; // preceding char was !
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	317 for (; pos < fbuf.length; ++pos) {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	318 if (Util.isSpace(fbuf[pos])) continue; // whitespace
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	319 else if (fbuf[pos] == '<') { // data tag
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	320 char[] type, data;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	321 ID tagID;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	322
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	323 // Type section of tag:
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	324 fbufIncrement (pos);
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	325 uint pos_s = pos;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	326 fbufLocateDataTagChar (pos, false); // find end of type section
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	327 if (fbuf[pos] != '\|') throwMTErr (ERR_DTAG ~ ErrInFile);
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	328 type = fbuf[pos_s..pos];
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	329 // ID section of tag:
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	330 fbufIncrement (pos);
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	331 try {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	332 tagID = fbufReadID (pos); // read the ID, put pos at whatever's next
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	333 } catch (MTStringIDException) {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	334 comment = true; // easiest way to ignore this tag
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	335 }
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	336 if (fbuf[pos] != '=') throwMTErr (ERR_DTAG ~ ErrInFile);
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	337 // Data section of tag:
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	338 fbufIncrement (pos);
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	339 pos_s = pos;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	340 fbufLocateDataTagChar (pos, true); // find end of data section
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	341 if (fbuf[pos] != '>') throwMTErr (ERR_DTAG ~ ErrInFile);
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	342 data = fbuf[pos_s..pos];
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	343
2 78eb491bd642 mergetag: partially redesigned dataset and text reader classes. Changed text format. Diggory Hardy <diggory.hardy@gmail.com> parents: 1 diff changeset	344 if (!comment && addTag != null) {
3 485c98ecbd91 text.parse: fixed a small bug with char[]'s. Diggory Hardy <diggory.hardy@gmail.com> parents: 2 diff changeset	345 TypeInfo* ti_p = Util.trim(type) in typeTable;
2 78eb491bd642 mergetag: partially redesigned dataset and text reader classes. Changed text format. Diggory Hardy <diggory.hardy@gmail.com> parents: 1 diff changeset	346 if (ti_p) addTag (*ti_p, tagID, data);
78eb491bd642 mergetag: partially redesigned dataset and text reader classes. Changed text format. Diggory Hardy <diggory.hardy@gmail.com> parents: 1 diff changeset	347 else logger.warn ("Type not supported: " ~ type);
0 d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	348 } else comment = false; // cancel comment status now
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	349 }
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	350 else if (fbuf[pos] == '{') {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	351 if (comment) { // simple block comment
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	352 uint depth = 0; // depth of embedded comment blocks
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	353 while (true) {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	354 fbufIncrement (pos);
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	355 if (fbuf[pos] == '}') {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	356 if (depth == 0) break;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	357 else --depth;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	358 } else if (fbuf[pos] == '{')
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	359 ++depth;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	360 }
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	361 comment = false; // end of this comment
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	362 } else {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	363 return pos; // next section coming up; we are done
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	364 }
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	365 }
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	366 else if (fbuf[pos] == '!') { // possibly a comment; check next char
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	367 comment = true; // starting a comment (or an error)
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	368 // variable is reset at end of comment
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	369 } else // must be an error
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	370 throwMTErr (ERR_CHAR ~ ErrInFile);
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	371 }
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	372 // if code execution reaches here, we're at EOF
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	373 // possible error: last character was ! (but don't bother checking since it's inconsequential)
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	374 return pos;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	375 }
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	376
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	377 /* Look for a section; return it if it exists otherwise create a new section:
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	378 * use dataSecCreator if it exists or just create a DefaultData if not.
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	379 */
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	380 DataSection getOrCreateSec (ID id) {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	381 DataSection* i = id in dataset.sec;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	382 if (i) return *i;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	383 return (dataset.sec[id] = (dataSecCreator != null) ? dataSecCreator(id) : new DefaultData);
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	384 }
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	385
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	386 /* Parses fbuf for a section marker. Already knows fbuf[pos] == '{'.
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	387 */
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	388 private ID fbufReadSecMarker (inout uint pos) {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	389 // at this point pos is whatever a parseSection run returned
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	390 // since we haven't hit EOF, fbuf[pos] MUST be '{' so no need to check
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	391 fbufIncrement(pos);
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	392 ID id = fbufReadID (pos);
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	393 if (fbuf[pos] != '}') throwMTErr (ERR_STAG ~ ErrInFile);
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	394 fbufIncrement(pos);
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	395 return id;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	396 }
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	397
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	398 /* Parses fbuf from pos to read an ID.
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	399 On return pos is the index of the character following the ID.
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	400 */
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	401 private ID fbufReadID (inout uint pos) {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	402 while (Util.isSpace(fbuf[pos])) fbufIncrement(pos); // skip any space
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	403 if (fbuf[pos] == '"') {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	404 fbufIncrement(pos);
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	405 uint start = pos;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	406 while (fbuf[pos] != '"') fbufIncrement(pos);
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	407 ID* i_p = fbuf[start..pos] in indexTable;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	408 while (Util.isSpace(fbuf[pos])) fbufIncrement(pos); // skip any space
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	409 if (i_p != null) return *i_p; // looked-up value
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	410 // FIXME: log a warning
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	411 throw new MTStringIDException (); // string not in look-up table
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	412 } else {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	413 uint ate;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	414 long x = ConvInt.parse (fbuf[pos..$], 0, &ate);
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	415 if (x < 0L \|\| x > 0xFFFF_FFFFL) throwMTErr (ERR_IDINT ~ ErrInFile);
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	416 pos += ate; // this is where ConvInt.parse stopped
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	417 while (Util.isSpace(fbuf[pos])) fbufIncrement(pos); // skip any space
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	418 return cast(ID) x;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	419 }
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	420 }
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	421
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	422 /* Searches fbuf starting from start to find one of <=>\| and stops at its index.
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	423
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	424 If quotable then be quote-aware for single and double quotes.
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	425 Note: there's no length restriction for the content of the quote since it could be a single
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	426 non-ascii UTF-8 char which would look like several chars.
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	427 */
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	428 private void fbufLocateDataTagChar (inout uint pos, bool quotable) {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	429 for (; pos < fbuf.length; ++pos) {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	430 if ((fbuf[pos] >= '<' && fbuf[pos] <= '>') \|\| fbuf[pos] == '\|') return;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	431 else if (quotable) {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	432 if (fbuf[pos] == '\'') {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	433 do {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	434 fbufIncrement(pos);
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	435 } while (fbuf[pos] != '\'')
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	436 } else if (fbuf[pos] == '"') {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	437 do {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	438 fbufIncrement(pos);
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	439 } while (fbuf[pos] != '"')
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	440 }
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	441 }
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	442 }
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	443 }
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	444 /* Increments pos and checks it hasn't hit fbuf.length . */
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	445 private void fbufIncrement(inout uint pos) {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	446 ++pos;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	447 if (pos >= fbuf.length) throwMTErr(ERR_EOF ~ ErrInFile);
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	448 }
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	449
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	450 private void throwMTErr (char[] msg, Exception exc = new MTException) {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	451 fatal = true; // if anyone catches the error and tries to do anything --- we're dead now
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	452 logger.error (msg); // report the error
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	453 throw exc; // and signal our error
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	454 }
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	455 //END METHODS: PRIVATE
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	456
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	457 invariant {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	458 // Check secTable is valid, but not if it's complete.
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	459 // This is something I really wouldn't expect to fail.
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	460 /+ um... this causes a lot of linker errors. Shouldn't be necessary anyway..
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	461 foreach (ID id, SecMD smd; secTable) {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	462 uint pos = smd.pos;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	463 for (; true; --pos) {
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	464 assert (pos); // we should never reach 0
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	465 if (fbuf[pos] == '{') break;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	466 }
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	467 ++pos;
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	468 assert (fbufReadID(pos) == id);
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	469 }+/
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	470 }
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	471 /+ A unittest here is really not practical since a file must be read from. Suggestion: Involve
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	472 + both reading and writing functions in a single unittest for the entire package mergetag.
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	473 + This is just here to point anyone looking in the right direction...
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	474 unittest {}
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	475 +/
d547009c104c Repository creation. Diggory Hardy <diggory.hardy@gmail.com> parents: diff changeset	476 }

Mercurial > projects > mde

annotate mde/mergetag/read.d @ 3:485c98ecbd91