[BACK]Return to mandoc.c CVS log [TXT][DIR] Up to [local] / src / usr.bin / mandoc

Annotation of src/usr.bin/mandoc/mandoc.c, Revision 1.62

1.62    ! schwarze    1: /*     $OpenBSD: mandoc.c,v 1.61 2015/08/29 22:39:59 schwarze Exp $ */
1.1       schwarze    2: /*
1.58      schwarze    3:  * Copyright (c) 2008-2011, 2014 Kristaps Dzonsons <kristaps@bsd.lv>
                      4:  * Copyright (c) 2011-2015 Ingo Schwarze <schwarze@openbsd.org>
1.1       schwarze    5:  *
                      6:  * Permission to use, copy, modify, and distribute this software for any
                      7:  * purpose with or without fee is hereby granted, provided that the above
                      8:  * copyright notice and this permission notice appear in all copies.
                      9:  *
1.21      schwarze   10:  * THE SOFTWARE IS PROVIDED "AS IS" AND THE AUTHORS DISCLAIM ALL WARRANTIES
1.1       schwarze   11:  * WITH REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED WARRANTIES OF
1.21      schwarze   12:  * MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL THE AUTHORS BE LIABLE FOR
1.1       schwarze   13:  * ANY SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL DAMAGES OR ANY DAMAGES
                     14:  * WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN
                     15:  * ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF
                     16:  * OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.
                     17:  */
1.2       schwarze   18: #include <sys/types.h>
                     19:
1.1       schwarze   20: #include <assert.h>
                     21: #include <ctype.h>
1.26      schwarze   22: #include <errno.h>
                     23: #include <limits.h>
1.1       schwarze   24: #include <stdlib.h>
1.4       schwarze   25: #include <stdio.h>
                     26: #include <string.h>
1.5       schwarze   27: #include <time.h>
1.1       schwarze   28:
1.14      schwarze   29: #include "mandoc.h"
1.45      schwarze   30: #include "mandoc_aux.h"
1.1       schwarze   31: #include "libmandoc.h"
                     32:
1.22      schwarze   33: #define DATESIZE 32
                     34:
1.14      schwarze   35: static int      a2time(time_t *, const char *, const char *);
1.22      schwarze   36: static char    *time2a(time_t);
1.5       schwarze   37:
1.26      schwarze   38:
                     39: enum mandoc_esc
1.44      schwarze   40: mandoc_escape(const char **end, const char **start, int *sz)
1.26      schwarze   41: {
1.34      schwarze   42:        const char      *local_start;
                     43:        int              local_sz;
                     44:        char             term;
1.48      schwarze   45:        enum mandoc_esc  gly;
1.26      schwarze   46:
1.34      schwarze   47:        /*
                     48:         * When the caller doesn't provide return storage,
                     49:         * use local storage.
                     50:         */
                     51:
                     52:        if (NULL == start)
                     53:                start = &local_start;
                     54:        if (NULL == sz)
                     55:                sz = &local_sz;
                     56:
                     57:        /*
                     58:         * Beyond the backslash, at least one input character
                     59:         * is part of the escape sequence.  With one exception
                     60:         * (see below), that character won't be returned.
                     61:         */
                     62:
1.26      schwarze   63:        gly = ESCAPE_ERROR;
1.34      schwarze   64:        *start = ++*end;
                     65:        *sz = 0;
1.33      schwarze   66:        term = '\0';
1.26      schwarze   67:
1.34      schwarze   68:        switch ((*start)[-1]) {
1.26      schwarze   69:        /*
                     70:         * First the glyphs.  There are several different forms of
                     71:         * these, but each eventually returns a substring of the glyph
                     72:         * name.
                     73:         */
1.48      schwarze   74:        case '(':
1.26      schwarze   75:                gly = ESCAPE_SPECIAL;
1.34      schwarze   76:                *sz = 2;
1.26      schwarze   77:                break;
1.48      schwarze   78:        case '[':
1.26      schwarze   79:                gly = ESCAPE_SPECIAL;
                     80:                term = ']';
                     81:                break;
1.48      schwarze   82:        case 'C':
1.34      schwarze   83:                if ('\'' != **start)
1.62    ! schwarze   84:                        return ESCAPE_ERROR;
1.34      schwarze   85:                *start = ++*end;
1.54      schwarze   86:                gly = ESCAPE_SPECIAL;
1.26      schwarze   87:                term = '\'';
                     88:                break;
1.41      schwarze   89:
                     90:        /*
                     91:         * Escapes taking no arguments at all.
                     92:         */
1.48      schwarze   93:        case 'd':
1.41      schwarze   94:                /* FALLTHROUGH */
1.48      schwarze   95:        case 'u':
1.61      schwarze   96:                /* FALLTHROUGH */
                     97:        case ',':
                     98:                /* FALLTHROUGH */
                     99:        case '/':
1.62    ! schwarze  100:                return ESCAPE_IGNORE;
1.32      schwarze  101:
                    102:        /*
                    103:         * The \z escape is supposed to output the following
1.48      schwarze  104:         * character without advancing the cursor position.
1.32      schwarze  105:         * Since we are mostly dealing with terminal mode,
                    106:         * let us just skip the next character.
                    107:         */
1.48      schwarze  108:        case 'z':
1.62    ! schwarze  109:                return ESCAPE_SKIPCHAR;
1.1       schwarze  110:
1.26      schwarze  111:        /*
                    112:         * Handle all triggers matching \X(xy, \Xx, and \X[xxxx], where
                    113:         * 'X' is the trigger.  These have opaque sub-strings.
                    114:         */
1.48      schwarze  115:        case 'F':
1.16      schwarze  116:                /* FALLTHROUGH */
1.48      schwarze  117:        case 'g':
1.16      schwarze  118:                /* FALLTHROUGH */
1.48      schwarze  119:        case 'k':
1.1       schwarze  120:                /* FALLTHROUGH */
1.48      schwarze  121:        case 'M':
1.14      schwarze  122:                /* FALLTHROUGH */
1.48      schwarze  123:        case 'm':
1.1       schwarze  124:                /* FALLTHROUGH */
1.48      schwarze  125:        case 'n':
1.1       schwarze  126:                /* FALLTHROUGH */
1.48      schwarze  127:        case 'V':
1.1       schwarze  128:                /* FALLTHROUGH */
1.48      schwarze  129:        case 'Y':
1.29      schwarze  130:                gly = ESCAPE_IGNORE;
1.1       schwarze  131:                /* FALLTHROUGH */
1.48      schwarze  132:        case 'f':
1.26      schwarze  133:                if (ESCAPE_ERROR == gly)
                    134:                        gly = ESCAPE_FONT;
1.34      schwarze  135:                switch (**start) {
1.48      schwarze  136:                case '(':
1.34      schwarze  137:                        *start = ++*end;
                    138:                        *sz = 2;
1.26      schwarze  139:                        break;
1.48      schwarze  140:                case '[':
1.34      schwarze  141:                        *start = ++*end;
1.26      schwarze  142:                        term = ']';
                    143:                        break;
                    144:                default:
1.34      schwarze  145:                        *sz = 1;
1.26      schwarze  146:                        break;
                    147:                }
                    148:                break;
                    149:
                    150:        /*
                    151:         * These escapes are of the form \X'Y', where 'X' is the trigger
                    152:         * and 'Y' is any string.  These have opaque sub-strings.
1.47      schwarze  153:         * The \B and \w escapes are handled in roff.c, roff_res().
1.26      schwarze  154:         */
1.48      schwarze  155:        case 'A':
1.13      schwarze  156:                /* FALLTHROUGH */
1.48      schwarze  157:        case 'b':
1.1       schwarze  158:                /* FALLTHROUGH */
1.48      schwarze  159:        case 'D':
1.1       schwarze  160:                /* FALLTHROUGH */
1.48      schwarze  161:        case 'R':
1.42      schwarze  162:                /* FALLTHROUGH */
1.48      schwarze  163:        case 'X':
1.1       schwarze  164:                /* FALLTHROUGH */
1.48      schwarze  165:        case 'Z':
1.59      schwarze  166:                gly = ESCAPE_IGNORE;
                    167:                /* FALLTHROUGH */
                    168:        case 'o':
                    169:                if (**start == '\0')
1.62    ! schwarze  170:                        return ESCAPE_ERROR;
1.59      schwarze  171:                if (gly == ESCAPE_ERROR)
                    172:                        gly = ESCAPE_OVERSTRIKE;
1.46      schwarze  173:                term = **start;
1.34      schwarze  174:                *start = ++*end;
1.16      schwarze  175:                break;
1.26      schwarze  176:
                    177:        /*
                    178:         * These escapes are of the form \X'N', where 'X' is the trigger
                    179:         * and 'N' resolves to a numerical expression.
                    180:         */
1.48      schwarze  181:        case 'h':
1.17      schwarze  182:                /* FALLTHROUGH */
1.48      schwarze  183:        case 'H':
1.26      schwarze  184:                /* FALLTHROUGH */
1.48      schwarze  185:        case 'L':
1.26      schwarze  186:                /* FALLTHROUGH */
1.48      schwarze  187:        case 'l':
1.26      schwarze  188:                /* FALLTHROUGH */
1.48      schwarze  189:        case 'S':
1.26      schwarze  190:                /* FALLTHROUGH */
1.48      schwarze  191:        case 'v':
1.17      schwarze  192:                /* FALLTHROUGH */
1.48      schwarze  193:        case 'x':
1.51      schwarze  194:                if (strchr(" %&()*+-./0123456789:<=>", **start)) {
1.53      schwarze  195:                        if ('\0' != **start)
                    196:                                ++*end;
1.62    ! schwarze  197:                        return ESCAPE_ERROR;
1.51      schwarze  198:                }
1.42      schwarze  199:                gly = ESCAPE_IGNORE;
1.46      schwarze  200:                term = **start;
1.34      schwarze  201:                *start = ++*end;
1.26      schwarze  202:                break;
1.29      schwarze  203:
                    204:        /*
                    205:         * Special handling for the numbered character escape.
                    206:         * XXX Do any other escapes need similar handling?
                    207:         */
1.48      schwarze  208:        case 'N':
1.34      schwarze  209:                if ('\0' == **start)
1.62    ! schwarze  210:                        return ESCAPE_ERROR;
1.34      schwarze  211:                (*end)++;
                    212:                if (isdigit((unsigned char)**start)) {
                    213:                        *sz = 1;
1.62    ! schwarze  214:                        return ESCAPE_IGNORE;
1.34      schwarze  215:                }
                    216:                (*start)++;
1.29      schwarze  217:                while (isdigit((unsigned char)**end))
                    218:                        (*end)++;
1.34      schwarze  219:                *sz = *end - *start;
1.29      schwarze  220:                if ('\0' != **end)
                    221:                        (*end)++;
1.62    ! schwarze  222:                return ESCAPE_NUMBERED;
1.26      schwarze  223:
1.48      schwarze  224:        /*
1.26      schwarze  225:         * Sizes get a special category of their own.
                    226:         */
1.48      schwarze  227:        case 's':
1.26      schwarze  228:                gly = ESCAPE_IGNORE;
1.17      schwarze  229:
1.26      schwarze  230:                /* See +/- counts as a sign. */
1.34      schwarze  231:                if ('+' == **end || '-' == **end || ASCII_HYPH == **end)
1.58      schwarze  232:                        *start = ++*end;
1.6       schwarze  233:
1.34      schwarze  234:                switch (**end) {
1.48      schwarze  235:                case '(':
1.34      schwarze  236:                        *start = ++*end;
                    237:                        *sz = 2;
1.16      schwarze  238:                        break;
1.48      schwarze  239:                case '[':
1.34      schwarze  240:                        *start = ++*end;
1.33      schwarze  241:                        term = ']';
1.16      schwarze  242:                        break;
1.48      schwarze  243:                case '\'':
1.34      schwarze  244:                        *start = ++*end;
1.33      schwarze  245:                        term = '\'';
1.60      schwarze  246:                        break;
                    247:                case '3':
                    248:                        /* FALLTHROUGH */
                    249:                case '2':
                    250:                        /* FALLTHROUGH */
                    251:                case '1':
                    252:                        *sz = (*end)[-1] == 's' &&
                    253:                            isdigit((unsigned char)(*end)[1]) ? 2 : 1;
1.16      schwarze  254:                        break;
                    255:                default:
1.34      schwarze  256:                        *sz = 1;
1.16      schwarze  257:                        break;
1.6       schwarze  258:                }
                    259:
1.26      schwarze  260:                break;
                    261:
                    262:        /*
                    263:         * Anything else is assumed to be a glyph.
1.34      schwarze  264:         * In this case, pass back the character after the backslash.
1.26      schwarze  265:         */
                    266:        default:
                    267:                gly = ESCAPE_SPECIAL;
1.34      schwarze  268:                *start = --*end;
                    269:                *sz = 1;
1.26      schwarze  270:                break;
                    271:        }
                    272:
                    273:        assert(ESCAPE_ERROR != gly);
                    274:
                    275:        /*
1.33      schwarze  276:         * Read up to the terminating character,
                    277:         * paying attention to nested escapes.
1.26      schwarze  278:         */
                    279:
                    280:        if ('\0' != term) {
1.33      schwarze  281:                while (**end != term) {
                    282:                        switch (**end) {
1.48      schwarze  283:                        case '\0':
1.62    ! schwarze  284:                                return ESCAPE_ERROR;
1.48      schwarze  285:                        case '\\':
1.33      schwarze  286:                                (*end)++;
                    287:                                if (ESCAPE_ERROR ==
                    288:                                    mandoc_escape(end, NULL, NULL))
1.62    ! schwarze  289:                                        return ESCAPE_ERROR;
1.33      schwarze  290:                                break;
                    291:                        default:
                    292:                                (*end)++;
                    293:                                break;
                    294:                        }
                    295:                }
1.34      schwarze  296:                *sz = (*end)++ - *start;
1.33      schwarze  297:        } else {
1.34      schwarze  298:                assert(*sz > 0);
                    299:                if ((size_t)*sz > strlen(*start))
1.62    ! schwarze  300:                        return ESCAPE_ERROR;
1.34      schwarze  301:                *end += *sz;
1.26      schwarze  302:        }
1.19      schwarze  303:
1.26      schwarze  304:        /* Run post-processors. */
1.19      schwarze  305:
1.26      schwarze  306:        switch (gly) {
1.48      schwarze  307:        case ESCAPE_FONT:
1.37      schwarze  308:                if (2 == *sz) {
                    309:                        if ('C' == **start) {
                    310:                                /*
                    311:                                 * Treat constant-width font modes
                    312:                                 * just like regular font modes.
                    313:                                 */
                    314:                                (*start)++;
                    315:                                (*sz)--;
                    316:                        } else {
                    317:                                if ('B' == (*start)[0] && 'I' == (*start)[1])
                    318:                                        gly = ESCAPE_FONTBI;
                    319:                                break;
                    320:                        }
1.34      schwarze  321:                } else if (1 != *sz)
1.26      schwarze  322:                        break;
1.30      schwarze  323:
1.34      schwarze  324:                switch (**start) {
1.48      schwarze  325:                case '3':
1.26      schwarze  326:                        /* FALLTHROUGH */
1.48      schwarze  327:                case 'B':
1.26      schwarze  328:                        gly = ESCAPE_FONTBOLD;
                    329:                        break;
1.48      schwarze  330:                case '2':
1.26      schwarze  331:                        /* FALLTHROUGH */
1.48      schwarze  332:                case 'I':
1.26      schwarze  333:                        gly = ESCAPE_FONTITALIC;
1.16      schwarze  334:                        break;
1.48      schwarze  335:                case 'P':
1.26      schwarze  336:                        gly = ESCAPE_FONTPREV;
1.16      schwarze  337:                        break;
1.48      schwarze  338:                case '1':
1.26      schwarze  339:                        /* FALLTHROUGH */
1.48      schwarze  340:                case 'R':
1.26      schwarze  341:                        gly = ESCAPE_FONTROMAN;
1.1       schwarze  342:                        break;
                    343:                }
1.16      schwarze  344:                break;
1.48      schwarze  345:        case ESCAPE_SPECIAL:
1.34      schwarze  346:                if (1 == *sz && 'c' == **start)
1.26      schwarze  347:                        gly = ESCAPE_NOSPACE;
1.54      schwarze  348:                /*
1.55      schwarze  349:                 * Unicode escapes are defined in groff as \[u0000]
1.54      schwarze  350:                 * to \[u10FFFF], where the contained value must be
                    351:                 * a valid Unicode codepoint.  Here, however, only
1.55      schwarze  352:                 * check the length and range.
1.54      schwarze  353:                 */
1.55      schwarze  354:                if (**start != 'u' || *sz < 5 || *sz > 7)
                    355:                        break;
                    356:                if (*sz == 7 && ((*start)[1] != '1' || (*start)[2] != '0'))
                    357:                        break;
                    358:                if (*sz == 6 && (*start)[1] == '0')
                    359:                        break;
                    360:                if ((int)strspn(*start + 1, "0123456789ABCDEFabcdef")
1.54      schwarze  361:                    + 1 == *sz)
                    362:                        gly = ESCAPE_UNICODE;
1.16      schwarze  363:                break;
1.1       schwarze  364:        default:
1.16      schwarze  365:                break;
1.1       schwarze  366:        }
                    367:
1.62    ! schwarze  368:        return gly;
1.21      schwarze  369: }
                    370:
                    371: /*
                    372:  * Parse a quoted or unquoted roff-style request or macro argument.
                    373:  * Return a pointer to the parsed argument, which is either the original
                    374:  * pointer or advanced by one byte in case the argument is quoted.
1.40      schwarze  375:  * NUL-terminate the argument in place.
1.21      schwarze  376:  * Collapse pairs of quotes inside quoted arguments.
                    377:  * Advance the argument pointer to the next argument,
1.40      schwarze  378:  * or to the NUL byte terminating the argument line.
1.21      schwarze  379:  */
                    380: char *
1.25      schwarze  381: mandoc_getarg(struct mparse *parse, char **cpp, int ln, int *pos)
1.21      schwarze  382: {
                    383:        char     *start, *cp;
                    384:        int       quoted, pairs, white;
                    385:
                    386:        /* Quoting can only start with a new word. */
                    387:        start = *cpp;
1.26      schwarze  388:        quoted = 0;
1.21      schwarze  389:        if ('"' == *start) {
                    390:                quoted = 1;
                    391:                start++;
1.48      schwarze  392:        }
1.21      schwarze  393:
                    394:        pairs = 0;
                    395:        white = 0;
                    396:        for (cp = start; '\0' != *cp; cp++) {
1.36      schwarze  397:
                    398:                /*
                    399:                 * Move the following text left
                    400:                 * after quoted quotes and after "\\" and "\t".
                    401:                 */
1.21      schwarze  402:                if (pairs)
                    403:                        cp[-pairs] = cp[0];
1.36      schwarze  404:
1.21      schwarze  405:                if ('\\' == cp[0]) {
1.36      schwarze  406:                        /*
                    407:                         * In copy mode, translate double to single
                    408:                         * backslashes and backslash-t to literal tabs.
                    409:                         */
                    410:                        switch (cp[1]) {
1.48      schwarze  411:                        case 't':
1.36      schwarze  412:                                cp[0] = '\t';
                    413:                                /* FALLTHROUGH */
1.48      schwarze  414:                        case '\\':
1.21      schwarze  415:                                pairs++;
                    416:                                cp++;
1.36      schwarze  417:                                break;
1.48      schwarze  418:                        case ' ':
1.21      schwarze  419:                                /* Skip escaped blanks. */
1.36      schwarze  420:                                if (0 == quoted)
                    421:                                        cp++;
                    422:                                break;
                    423:                        default:
                    424:                                break;
                    425:                        }
1.21      schwarze  426:                } else if (0 == quoted) {
                    427:                        if (' ' == cp[0]) {
                    428:                                /* Unescaped blanks end unquoted args. */
                    429:                                white = 1;
                    430:                                break;
                    431:                        }
                    432:                } else if ('"' == cp[0]) {
                    433:                        if ('"' == cp[1]) {
                    434:                                /* Quoted quotes collapse. */
                    435:                                pairs++;
                    436:                                cp++;
                    437:                        } else {
                    438:                                /* Unquoted quotes end quoted args. */
                    439:                                quoted = 2;
                    440:                                break;
                    441:                        }
                    442:                }
                    443:        }
                    444:
                    445:        /* Quoted argument without a closing quote. */
1.25      schwarze  446:        if (1 == quoted)
1.52      schwarze  447:                mandoc_msg(MANDOCERR_ARG_QUOTE, parse, ln, *pos, NULL);
1.21      schwarze  448:
1.40      schwarze  449:        /* NUL-terminate this argument and move to the next one. */
1.21      schwarze  450:        if (pairs)
                    451:                cp[-pairs] = '\0';
                    452:        if ('\0' != *cp) {
                    453:                *cp++ = '\0';
                    454:                while (' ' == *cp)
                    455:                        cp++;
                    456:        }
1.24      schwarze  457:        *pos += (int)(cp - start) + (quoted ? 1 : 0);
1.21      schwarze  458:        *cpp = cp;
                    459:
1.25      schwarze  460:        if ('\0' == *cp && (white || ' ' == cp[-1]))
1.52      schwarze  461:                mandoc_msg(MANDOCERR_SPACE_EOL, parse, ln, *pos, NULL);
1.21      schwarze  462:
1.62    ! schwarze  463:        return start;
1.4       schwarze  464: }
1.5       schwarze  465:
                    466: static int
                    467: a2time(time_t *t, const char *fmt, const char *p)
                    468: {
                    469:        struct tm        tm;
                    470:        char            *pp;
                    471:
                    472:        memset(&tm, 0, sizeof(struct tm));
                    473:
                    474:        pp = strptime(p, fmt, &tm);
                    475:        if (NULL != pp && '\0' == *pp) {
                    476:                *t = mktime(&tm);
1.62    ! schwarze  477:                return 1;
1.5       schwarze  478:        }
                    479:
1.62    ! schwarze  480:        return 0;
1.5       schwarze  481: }
                    482:
1.22      schwarze  483: static char *
                    484: time2a(time_t t)
                    485: {
1.28      schwarze  486:        struct tm       *tm;
1.23      schwarze  487:        char            *buf, *p;
                    488:        size_t           ssz;
1.22      schwarze  489:        int              isz;
                    490:
1.28      schwarze  491:        tm = localtime(&t);
1.57      schwarze  492:        if (tm == NULL)
1.62    ! schwarze  493:                return NULL;
1.22      schwarze  494:
1.23      schwarze  495:        /*
                    496:         * Reserve space:
                    497:         * up to 9 characters for the month (September) + blank
                    498:         * up to 2 characters for the day + comma + blank
                    499:         * 4 characters for the year and a terminating '\0'
                    500:         */
                    501:        p = buf = mandoc_malloc(10 + 4 + 4 + 1);
                    502:
1.28      schwarze  503:        if (0 == (ssz = strftime(p, 10 + 1, "%B ", tm)))
1.23      schwarze  504:                goto fail;
                    505:        p += (int)ssz;
1.22      schwarze  506:
1.28      schwarze  507:        if (-1 == (isz = snprintf(p, 4 + 1, "%d, ", tm->tm_mday)))
1.23      schwarze  508:                goto fail;
1.22      schwarze  509:        p += isz;
                    510:
1.28      schwarze  511:        if (0 == strftime(p, 4 + 1, "%Y", tm))
1.23      schwarze  512:                goto fail;
1.62    ! schwarze  513:        return buf;
1.23      schwarze  514:
                    515: fail:
                    516:        free(buf);
1.62    ! schwarze  517:        return NULL;
1.22      schwarze  518: }
                    519:
                    520: char *
1.25      schwarze  521: mandoc_normdate(struct mparse *parse, char *in, int ln, int pos)
1.5       schwarze  522: {
1.22      schwarze  523:        char            *out;
1.5       schwarze  524:        time_t           t;
                    525:
1.22      schwarze  526:        if (NULL == in || '\0' == *in ||
                    527:            0 == strcmp(in, "$" "Mdocdate$")) {
1.49      schwarze  528:                mandoc_msg(MANDOCERR_DATE_MISSING, parse, ln, pos, NULL);
1.22      schwarze  529:                time(&t);
                    530:        }
1.31      schwarze  531:        else if (a2time(&t, "%Y-%m-%d", in))
                    532:                t = 0;
1.22      schwarze  533:        else if (!a2time(&t, "$" "Mdocdate: %b %d %Y $", in) &&
1.31      schwarze  534:            !a2time(&t, "%b %d, %Y", in)) {
1.50      schwarze  535:                mandoc_msg(MANDOCERR_DATE_BAD, parse, ln, pos, in);
1.22      schwarze  536:                t = 0;
1.5       schwarze  537:        }
1.22      schwarze  538:        out = t ? time2a(t) : NULL;
1.62    ! schwarze  539:        return out ? out : mandoc_strdup(in);
1.5       schwarze  540: }
                    541:
1.9       schwarze  542: int
1.43      schwarze  543: mandoc_eos(const char *p, size_t sz)
1.9       schwarze  544: {
1.43      schwarze  545:        const char      *q;
                    546:        int              enclosed, found;
1.9       schwarze  547:
1.10      schwarze  548:        if (0 == sz)
1.62    ! schwarze  549:                return 0;
1.9       schwarze  550:
1.11      schwarze  551:        /*
                    552:         * End-of-sentence recognition must include situations where
                    553:         * some symbols, such as `)', allow prior EOS punctuation to
1.26      schwarze  554:         * propagate outward.
1.11      schwarze  555:         */
                    556:
1.43      schwarze  557:        enclosed = found = 0;
1.16      schwarze  558:        for (q = p + (int)sz - 1; q >= p; q--) {
1.15      schwarze  559:                switch (*q) {
1.48      schwarze  560:                case '\"':
1.11      schwarze  561:                        /* FALLTHROUGH */
1.48      schwarze  562:                case '\'':
1.11      schwarze  563:                        /* FALLTHROUGH */
1.48      schwarze  564:                case ']':
1.11      schwarze  565:                        /* FALLTHROUGH */
1.48      schwarze  566:                case ')':
1.15      schwarze  567:                        if (0 == found)
                    568:                                enclosed = 1;
1.11      schwarze  569:                        break;
1.48      schwarze  570:                case '.':
1.11      schwarze  571:                        /* FALLTHROUGH */
1.48      schwarze  572:                case '!':
1.11      schwarze  573:                        /* FALLTHROUGH */
1.48      schwarze  574:                case '?':
1.15      schwarze  575:                        found = 1;
                    576:                        break;
1.11      schwarze  577:                default:
1.62    ! schwarze  578:                        return found &&
        !           579:                            (!enclosed || isalnum((unsigned char)*q));
1.11      schwarze  580:                }
1.9       schwarze  581:        }
                    582:
1.62    ! schwarze  583:        return found && !enclosed;
1.9       schwarze  584: }
1.26      schwarze  585:
                    586: /*
                    587:  * Convert a string to a long that may not be <0.
                    588:  * If the string is invalid, or is less than 0, return -1.
                    589:  */
                    590: int
1.27      schwarze  591: mandoc_strntoi(const char *p, size_t sz, int base)
1.26      schwarze  592: {
                    593:        char             buf[32];
                    594:        char            *ep;
                    595:        long             v;
                    596:
                    597:        if (sz > 31)
1.62    ! schwarze  598:                return -1;
1.26      schwarze  599:
                    600:        memcpy(buf, p, sz);
                    601:        buf[(int)sz] = '\0';
                    602:
                    603:        errno = 0;
                    604:        v = strtol(buf, &ep, base);
                    605:
                    606:        if (buf[0] == '\0' || *ep != '\0')
1.62    ! schwarze  607:                return -1;
1.26      schwarze  608:
1.27      schwarze  609:        if (v > INT_MAX)
                    610:                v = INT_MAX;
                    611:        if (v < INT_MIN)
                    612:                v = INT_MIN;
1.26      schwarze  613:
1.62    ! schwarze  614:        return (int)v;
1.26      schwarze  615: }