src/usr.bin/mandoc/term.c - annotate

Return to term.c CVS log
Up to [local] / src / usr.bin / mandoc
Annotation of src/usr.bin/mandoc/term.c, Revision 1.130

1.130   ! schwarze    1: /*     $OpenBSD: term.c,v 1.129 2017/06/12 18:55:42 schwarze Exp $ */
1.1       kristaps    2: /*
1.59      schwarze    3:  * Copyright (c) 2008, 2009, 2010, 2011 Kristaps Dzonsons <kristaps@bsd.lv>
1.119     schwarze    4:  * Copyright (c) 2010-2017 Ingo Schwarze <schwarze@openbsd.org>
1.1       kristaps    5:  *
                      6:  * Permission to use, copy, modify, and distribute this software for any
1.2       schwarze    7:  * purpose with or without fee is hereby granted, provided that the above
                      8:  * copyright notice and this permission notice appear in all copies.
1.1       kristaps    9:  *
1.106     schwarze   10:  * THE SOFTWARE IS PROVIDED "AS IS" AND THE AUTHORS DISCLAIM ALL WARRANTIES
1.2       schwarze   11:  * WITH REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED WARRANTIES OF
1.106     schwarze   12:  * MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL THE AUTHORS BE LIABLE FOR
1.2       schwarze   13:  * ANY SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL DAMAGES OR ANY DAMAGES
                     14:  * WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN
                     15:  * ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF
                     16:  * OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.
1.1       kristaps   17:  */
1.20      schwarze   18: #include <sys/types.h>
                     19:
1.1       kristaps   20: #include <assert.h>
1.20      schwarze   21: #include <ctype.h>
1.1       kristaps   22: #include <stdio.h>
                     23: #include <stdlib.h>
                     24: #include <string.h>
                     25:
1.34      schwarze   26: #include "mandoc.h"
1.79      schwarze   27: #include "mandoc_aux.h"
1.16      schwarze   28: #include "out.h"
1.1       kristaps   29: #include "term.h"
1.16      schwarze   30: #include "main.h"
1.1       kristaps   31:
1.64      schwarze   32: static size_t           cond_width(const struct termp *, int, int *);
1.126     schwarze   33: static void             adjbuf(struct termp_col *, size_t);
1.59      schwarze   34: static void             bufferc(struct termp *, char);
                     35: static void             encode(struct termp *, const char *, size_t);
                     36: static void             encode1(struct termp *, int);
1.124     schwarze   37: static void             endline(struct termp *);
1.1       kristaps   38:
1.83      schwarze   39:
1.37      schwarze   40: void
1.129     schwarze   41: term_setcol(struct termp *p, size_t maxtcol)
                     42: {
                     43:        if (maxtcol > p->maxtcol) {
                     44:                p->tcols = mandoc_recallocarray(p->tcols,
                     45:                    p->maxtcol, maxtcol, sizeof(*p->tcols));
                     46:                p->maxtcol = maxtcol;
                     47:        }
                     48:        p->lasttcol = maxtcol - 1;
                     49:        p->tcol = p->tcols;
                     50: }
                     51:
                     52: void
1.37      schwarze   53: term_free(struct termp *p)
1.1       kristaps   54: {
1.126     schwarze   55:        for (p->tcol = p->tcols; p->tcol < p->tcols + p->maxtcol; p->tcol++)
                     56:                free(p->tcol->buf);
                     57:        free(p->tcols);
1.98      schwarze   58:        free(p->fontq);
1.37      schwarze   59:        free(p);
1.1       kristaps   60: }
                     61:
1.13      schwarze   62: void
1.83      schwarze   63: term_begin(struct termp *p, term_margin head,
1.106     schwarze   64:                term_margin foot, const struct roff_meta *arg)
1.1       kristaps   65: {
                     66:
1.37      schwarze   67:        p->headf = head;
                     68:        p->footf = foot;
                     69:        p->argf = arg;
                     70:        (*p->begin)(p);
1.1       kristaps   71: }
                     72:
1.37      schwarze   73: void
                     74: term_end(struct termp *p)
1.1       kristaps   75: {
                     76:
1.37      schwarze   77:        (*p->end)(p);
1.1       kristaps   78: }
                     79:
                     80: /*
1.82      schwarze   81:  * Flush a chunk of text.  By default, break the output line each time
                     82:  * the right margin is reached, and continue output on the next line
                     83:  * at the same offset as the chunk itself.  By default, also break the
                     84:  * output line at the end of the chunk.
1.27      schwarze   85:  * The following flags may be specified:
1.1       kristaps   86:  *
1.82      schwarze   87:  *  - TERMP_NOBREAK: Do not break the output line at the right margin,
                     88:  *    but only at the max right margin.  Also, do not break the output
                     89:  *    line at the end of the chunk, such that the next call can pad to
                     90:  *    the next column.  However, if less than p->trailspace blanks,
                     91:  *    which can be 0, 1, or 2, remain to the right margin, the line
                     92:  *    will be broken.
1.110     schwarze   93:  *  - TERMP_BRTRSP: Consider trailing whitespace significant
                     94:  *    when deciding whether the chunk fits or not.
1.82      schwarze   95:  *  - TERMP_BRIND: If the chunk does not fit and the output line has
                     96:  *    to be broken, start the next line at the right margin instead
                     97:  *    of at the offset.  Used together with TERMP_NOBREAK for the tags
                     98:  *    in various kinds of tagged lists.
1.123     schwarze   99:  *  - TERMP_HANG: Do not break the output line at the right margin,
1.82      schwarze  100:  *    append the next chunk after it even if this one is too long.
                    101:  *    To be used together with TERMP_NOBREAK.
1.123     schwarze  102:  *  - TERMP_NOPAD: Start writing at the current position,
                    103:  *    do not pad with blank characters up to the offset.
1.1       kristaps  104:  */
                    105: void
                    106: term_flushln(struct termp *p)
                    107: {
1.19      schwarze  108:        size_t           vis;   /* current visual position on output */
                    109:        size_t           vbl;   /* number of blanks to prepend to output */
1.33      schwarze  110:        size_t           vend;  /* end of word visual position on output */
1.19      schwarze  111:        size_t           bp;    /* visual right border position */
1.51      schwarze  112:        size_t           dv;    /* temporary for visual pos calculations */
1.126     schwarze  113:        size_t           j;     /* temporary loop index for p->tcol->buf */
1.71      schwarze  114:        size_t           jhy;   /* last hyph before overflow w/r/t j */
1.42      schwarze  115:        size_t           maxvis; /* output position of visible boundary */
1.126     schwarze  116:        int              ntab;  /* number of tabs to prepend */
1.130   ! schwarze  117:        int              breakline; /* after this word */
1.1       kristaps  118:
1.126     schwarze  119:        vbl = (p->flags & TERMP_NOPAD) || p->tcol->offset < p->viscol ?
                    120:            0 : p->tcol->offset - p->viscol;
1.123     schwarze  121:        if (p->minbl && vbl < p->minbl)
                    122:                vbl = p->minbl;
1.126     schwarze  123:        maxvis = p->tcol->rmargin > p->viscol + vbl ?
                    124:            p->tcol->rmargin - p->viscol - vbl : 0;
1.123     schwarze  125:        bp = !(p->flags & TERMP_NOBREAK) ? maxvis :
                    126:            p->maxrmargin > p->viscol + vbl ?
                    127:            p->maxrmargin - p->viscol - vbl : 0;
1.53      schwarze  128:        vis = vend = 0;
1.19      schwarze  129:
1.129     schwarze  130:        if ((p->flags && TERMP_MULTICOL) == 0)
1.127     schwarze  131:                p->tcol->col = 0;
1.129     schwarze  132:        while (p->tcol->col < p->tcol->lastcol) {
1.127     schwarze  133:
1.22      schwarze  134:                /*
1.42      schwarze  135:                 * Handle literal tab characters: collapse all
                    136:                 * subsequent tabs into a single huge set of spaces.
1.30      schwarze  137:                 */
1.127     schwarze  138:
1.66      schwarze  139:                ntab = 0;
1.129     schwarze  140:                while (p->tcol->col < p->tcol->lastcol &&
1.127     schwarze  141:                    p->tcol->buf[p->tcol->col] == '\t') {
1.120     schwarze  142:                        vend = term_tab_next(vis);
1.30      schwarze  143:                        vbl += vend - vis;
                    144:                        vis = vend;
1.66      schwarze  145:                        ntab++;
1.127     schwarze  146:                        p->tcol->col++;
1.30      schwarze  147:                }
1.22      schwarze  148:
1.1       kristaps  149:                /*
                    150:                 * Count up visible word characters.  Control sequences
                    151:                 * (starting with the CSI) aren't counted.  A space
                    152:                 * generates a non-printing word, which is valid (the
                    153:                 * space is printed according to regular spacing rules).
                    154:                 */
                    155:
1.127     schwarze  156:                jhy = 0;
1.130   ! schwarze  157:                breakline = 0;
1.129     schwarze  158:                for (j = p->tcol->col; j < p->tcol->lastcol; j++) {
1.130   ! schwarze  159:                        if (p->tcol->buf[j] == '\n') {
        !           160:                                if ((p->flags & TERMP_BRIND) == 0)
        !           161:                                        breakline = 1;
        !           162:                                continue;
        !           163:                        }
1.126     schwarze  164:                        if (p->tcol->buf[j] == ' ' || p->tcol->buf[j] == '\t')
1.1       kristaps  165:                                break;
1.42      schwarze  166:
1.117     krw       167:                        /* Back over the last printed character. */
1.126     schwarze  168:                        if (p->tcol->buf[j] == '\b') {
1.42      schwarze  169:                                assert(j);
1.126     schwarze  170:                                vend -= (*p->width)(p, p->tcol->buf[j - 1]);
1.42      schwarze  171:                                continue;
                    172:                        }
                    173:
                    174:                        /* Regular word. */
                    175:                        /* Break at the hyphen point if we overrun. */
1.83      schwarze  176:                        if (vend > vis && vend < bp &&
1.126     schwarze  177:                            (p->tcol->buf[j] == ASCII_HYPH||
                    178:                             p->tcol->buf[j] == ASCII_BREAK))
1.42      schwarze  179:                                jhy = j;
                    180:
1.78      schwarze  181:                        /*
                    182:                         * Hyphenation now decided, put back a real
                    183:                         * hyphen such that we get the correct width.
                    184:                         */
1.126     schwarze  185:                        if (p->tcol->buf[j] == ASCII_HYPH)
                    186:                                p->tcol->buf[j] = '-';
1.78      schwarze  187:
1.126     schwarze  188:                        vend += (*p->width)(p, p->tcol->buf[j]);
1.1       kristaps  189:                }
                    190:
                    191:                /*
1.5       schwarze  192:                 * Find out whether we would exceed the right margin.
1.33      schwarze  193:                 * If so, break to the next line.
1.5       schwarze  194:                 */
1.127     schwarze  195:
                    196:                if (vend > bp && jhy == 0 && vis > 0 &&
1.124     schwarze  197:                    (p->flags & TERMP_BRNEVER) == 0) {
1.129     schwarze  198:                        if (p->flags & TERMP_MULTICOL)
1.127     schwarze  199:                                return;
                    200:
                    201:                        endline(p);
1.22      schwarze  202:                        vend -= vis;
1.66      schwarze  203:
1.120     schwarze  204:                        /* Use pending tabs on the new line. */
                    205:
                    206:                        vbl = 0;
                    207:                        while (ntab--)
                    208:                                vbl = term_tab_next(vbl);
                    209:
                    210:                        /* Re-establish indentation. */
1.66      schwarze  211:
1.123     schwarze  212:                        if (p->flags & TERMP_BRIND)
1.126     schwarze  213:                                vbl += p->tcol->rmargin;
1.123     schwarze  214:                        else
1.126     schwarze  215:                                vbl += p->tcol->offset;
                    216:                        maxvis = p->tcol->rmargin > vbl ?
                    217:                            p->tcol->rmargin - vbl : 0;
1.123     schwarze  218:                        bp = !(p->flags & TERMP_NOBREAK) ? maxvis :
                    219:                            p->maxrmargin > vbl ?  p->maxrmargin - vbl : 0;
1.1       kristaps  220:                }
1.30      schwarze  221:
1.127     schwarze  222:                /*
                    223:                 * Write out the rest of the word.
                    224:                 */
                    225:
1.129     schwarze  226:                for ( ; p->tcol->col < p->tcol->lastcol; p->tcol->col++) {
1.127     schwarze  227:                        if (vend > bp && jhy > 0 && p->tcol->col > jhy)
1.30      schwarze  228:                                break;
1.130   ! schwarze  229:                        if (p->tcol->buf[p->tcol->col] == '\n')
        !           230:                                continue;
1.127     schwarze  231:                        if (p->tcol->buf[p->tcol->col] == '\t')
1.1       kristaps  232:                                break;
1.127     schwarze  233:                        if (p->tcol->buf[p->tcol->col] == ' ') {
                    234:                                j = p->tcol->col;
1.129     schwarze  235:                                while (p->tcol->col < p->tcol->lastcol &&
1.127     schwarze  236:                                    p->tcol->buf[p->tcol->col] == ' ')
                    237:                                        p->tcol->col++;
                    238:                                dv = (p->tcol->col - j) * (*p->width)(p, ' ');
1.51      schwarze  239:                                vbl += dv;
                    240:                                vend += dv;
1.22      schwarze  241:                                break;
                    242:                        }
1.127     schwarze  243:                        if (p->tcol->buf[p->tcol->col] == ASCII_NBRSP) {
1.42      schwarze  244:                                vbl += (*p->width)(p, ' ');
1.33      schwarze  245:                                continue;
                    246:                        }
1.127     schwarze  247:                        if (p->tcol->buf[p->tcol->col] == ASCII_BREAK)
1.77      schwarze  248:                                continue;
1.33      schwarze  249:
                    250:                        /*
                    251:                         * Now we definitely know there will be
                    252:                         * printable characters to output,
                    253:                         * so write preceding white space now.
                    254:                         */
                    255:                        if (vbl) {
1.37      schwarze  256:                                (*p->advance)(p, vbl);
1.33      schwarze  257:                                p->viscol += vbl;
                    258:                                vbl = 0;
1.61      schwarze  259:                        }
                    260:
1.127     schwarze  261:                        (*p->letter)(p, p->tcol->buf[p->tcol->col]);
                    262:                        if (p->tcol->buf[p->tcol->col] == '\b')
                    263:                                p->viscol -= (*p->width)(p,
                    264:                                    p->tcol->buf[p->tcol->col - 1]);
1.83      schwarze  265:                        else
1.127     schwarze  266:                                p->viscol += (*p->width)(p,
                    267:                                    p->tcol->buf[p->tcol->col]);
1.1       kristaps  268:                }
1.22      schwarze  269:                vis = vend;
1.130   ! schwarze  270:
        !           271:                if (breakline == 0)
        !           272:                        continue;
        !           273:
        !           274:                /* Explicitly requested output line break. */
        !           275:
        !           276:                if (p->flags & TERMP_MULTICOL)
        !           277:                        return;
        !           278:
        !           279:                endline(p);
        !           280:                breakline = 0;
        !           281:                vis = vend = 0;
        !           282:
        !           283:                /* Re-establish indentation. */
        !           284:
        !           285:                vbl = p->tcol->offset;
        !           286:                maxvis = p->tcol->rmargin > vbl ?
        !           287:                    p->tcol->rmargin - vbl : 0;
        !           288:                bp = !(p->flags & TERMP_NOBREAK) ? maxvis :
        !           289:                    p->maxrmargin > vbl ?  p->maxrmargin - vbl : 0;
1.1       kristaps  290:        }
1.48      schwarze  291:
                    292:        /*
                    293:         * If there was trailing white space, it was not printed;
                    294:         * so reset the cursor position accordingly.
                    295:         */
1.127     schwarze  296:
1.95      schwarze  297:        if (vis > vbl)
1.61      schwarze  298:                vis -= vbl;
1.95      schwarze  299:        else
                    300:                vis = 0;
1.18      schwarze  301:
1.129     schwarze  302:        p->col = p->tcol->col = p->tcol->lastcol = 0;
1.124     schwarze  303:        p->minbl = p->trailspace;
1.123     schwarze  304:        p->flags &= ~(TERMP_BACKAFTER | TERMP_BACKBEFORE | TERMP_NOPAD);
1.1       kristaps  305:
1.129     schwarze  306:        if (p->flags & TERMP_MULTICOL)
                    307:                return;
                    308:
1.110     schwarze  309:        /* Trailing whitespace is significant in some columns. */
1.127     schwarze  310:
1.110     schwarze  311:        if (vis && vbl && (TERMP_BRTRSP & p->flags))
                    312:                vis += vbl;
1.1       kristaps  313:
1.61      schwarze  314:        /* If the column was overrun, break the line. */
1.124     schwarze  315:        if ((p->flags & TERMP_NOBREAK) == 0 ||
                    316:            ((p->flags & TERMP_HANG) == 0 &&
                    317:             vis + p->trailspace * (*p->width)(p, ' ') > maxvis))
                    318:                endline(p);
                    319: }
                    320:
                    321: static void
                    322: endline(struct termp *p)
                    323: {
                    324:        if ((p->flags & (TERMP_NEWMC | TERMP_ENDMC)) == TERMP_ENDMC) {
                    325:                p->mc = NULL;
                    326:                p->flags &= ~TERMP_ENDMC;
                    327:        }
                    328:        if (p->mc != NULL) {
                    329:                if (p->viscol && p->maxrmargin >= p->viscol)
                    330:                        (*p->advance)(p, p->maxrmargin - p->viscol + 1);
                    331:                p->flags |= TERMP_NOBUF | TERMP_NOSPACE;
                    332:                term_word(p, p->mc);
                    333:                p->flags &= ~(TERMP_NOBUF | TERMP_NEWMC);
                    334:        }
                    335:        p->viscol = 0;
                    336:        p->minbl = 0;
                    337:        (*p->endline)(p);
1.1       kristaps  338: }
                    339:
1.83      schwarze  340: /*
1.1       kristaps  341:  * A newline only breaks an existing line; it won't assert vertical
                    342:  * space.  All data in the output buffer is flushed prior to the newline
                    343:  * assertion.
                    344:  */
                    345: void
                    346: term_newln(struct termp *p)
                    347: {
                    348:
                    349:        p->flags |= TERMP_NOSPACE;
1.129     schwarze  350:        if (p->tcol->lastcol || p->viscol)
1.61      schwarze  351:                term_flushln(p);
1.1       kristaps  352: }
                    353:
                    354: /*
                    355:  * Asserts a vertical space (a full, empty line-break between lines).
                    356:  * Note that if used twice, this will cause two blank spaces and so on.
                    357:  * All data in the output buffer is flushed prior to the newline
                    358:  * assertion.
                    359:  */
                    360: void
                    361: term_vspace(struct termp *p)
                    362: {
                    363:
                    364:        term_newln(p);
1.29      schwarze  365:        p->viscol = 0;
1.124     schwarze  366:        p->minbl = 0;
1.63      schwarze  367:        if (0 < p->skipvsp)
                    368:                p->skipvsp--;
                    369:        else
                    370:                (*p->endline)(p);
1.1       kristaps  371: }
                    372:
1.98      schwarze  373: /* Swap current and previous font; for \fP and .ft P */
1.20      schwarze  374: void
                    375: term_fontlast(struct termp *p)
                    376: {
                    377:        enum termfont    f;
1.11      schwarze  378:
1.20      schwarze  379:        f = p->fontl;
                    380:        p->fontl = p->fontq[p->fonti];
                    381:        p->fontq[p->fonti] = f;
                    382: }
                    383:
1.98      schwarze  384: /* Set font, save current, discard previous; for \f, .ft, .B etc. */
1.20      schwarze  385: void
                    386: term_fontrepl(struct termp *p, enum termfont f)
                    387: {
                    388:
                    389:        p->fontl = p->fontq[p->fonti];
                    390:        p->fontq[p->fonti] = f;
1.1       kristaps  391: }
                    392:
1.98      schwarze  393: /* Set font, save previous. */
1.20      schwarze  394: void
                    395: term_fontpush(struct termp *p, enum termfont f)
1.1       kristaps  396: {
1.7       schwarze  397:
1.20      schwarze  398:        p->fontl = p->fontq[p->fonti];
1.98      schwarze  399:        if (++p->fonti == p->fontsz) {
                    400:                p->fontsz += 8;
                    401:                p->fontq = mandoc_reallocarray(p->fontq,
1.116     schwarze  402:                    p->fontsz, sizeof(*p->fontq));
1.98      schwarze  403:        }
                    404:        p->fontq[p->fonti] = f;
1.20      schwarze  405: }
1.1       kristaps  406:
1.98      schwarze  407: /* Flush to make the saved pointer current again. */
1.20      schwarze  408: void
1.104     schwarze  409: term_fontpopq(struct termp *p, int i)
1.20      schwarze  410: {
1.1       kristaps  411:
1.104     schwarze  412:        assert(i >= 0);
                    413:        if (p->fonti > i)
                    414:                p->fonti = i;
1.20      schwarze  415: }
1.1       kristaps  416:
1.98      schwarze  417: /* Pop one font off the stack. */
1.20      schwarze  418: void
                    419: term_fontpop(struct termp *p)
                    420: {
1.1       kristaps  421:
1.20      schwarze  422:        assert(p->fonti);
                    423:        p->fonti--;
1.1       kristaps  424: }
                    425:
                    426: /*
                    427:  * Handle pwords, partial words, which may be either a single word or a
                    428:  * phrase that cannot be broken down (such as a literal string).  This
                    429:  * handles word styling.
                    430:  */
1.7       schwarze  431: void
                    432: term_word(struct termp *p, const char *word)
1.1       kristaps  433: {
1.121     schwarze  434:        struct roffsu    su;
1.75      schwarze  435:        const char       nbrsp[2] = { ASCII_NBRSP, 0 };
1.59      schwarze  436:        const char      *seq, *cp;
                    437:        int              sz, uc;
1.122     schwarze  438:        size_t           csz, lsz, ssz;
1.59      schwarze  439:        enum mandoc_esc  esc;
1.1       kristaps  440:
1.124     schwarze  441:        if ((p->flags & TERMP_NOBUF) == 0) {
                    442:                if ((p->flags & TERMP_NOSPACE) == 0) {
                    443:                        if ((p->flags & TERMP_KEEP) == 0) {
1.40      schwarze  444:                                bufferc(p, ' ');
1.124     schwarze  445:                                if (p->flags & TERMP_SENTENCE)
                    446:                                        bufferc(p, ' ');
                    447:                        } else
                    448:                                bufferc(p, ASCII_NBRSP);
                    449:                }
                    450:                if (p->flags & TERMP_PREKEEP)
                    451:                        p->flags |= TERMP_KEEP;
                    452:                if (p->flags & TERMP_NONOSPACE)
                    453:                        p->flags |= TERMP_NOSPACE;
                    454:                else
                    455:                        p->flags &= ~TERMP_NOSPACE;
                    456:                p->flags &= ~(TERMP_SENTENCE | TERMP_NONEWLINE);
                    457:                p->skipvsp = 0;
1.31      schwarze  458:        }
                    459:
1.59      schwarze  460:        while ('\0' != *word) {
1.64      schwarze  461:                if ('\\' != *word) {
1.75      schwarze  462:                        if (TERMP_NBRWORD & p->flags) {
                    463:                                if (' ' == *word) {
                    464:                                        encode(p, nbrsp, 1);
                    465:                                        word++;
                    466:                                        continue;
                    467:                                }
                    468:                                ssz = strcspn(word, "\\ ");
                    469:                        } else
                    470:                                ssz = strcspn(word, "\\");
1.45      schwarze  471:                        encode(p, word, ssz);
1.64      schwarze  472:                        word += (int)ssz;
1.20      schwarze  473:                        continue;
1.64      schwarze  474:                }
1.20      schwarze  475:
1.59      schwarze  476:                word++;
                    477:                esc = mandoc_escape(&word, &seq, &sz);
                    478:                if (ESCAPE_ERROR == esc)
1.85      schwarze  479:                        continue;
1.59      schwarze  480:
                    481:                switch (esc) {
1.83      schwarze  482:                case ESCAPE_UNICODE:
1.89      schwarze  483:                        uc = mchars_num2uc(seq + 1, sz - 1);
1.56      schwarze  484:                        break;
1.83      schwarze  485:                case ESCAPE_NUMBERED:
1.93      schwarze  486:                        uc = mchars_num2char(seq, sz);
                    487:                        if (uc < 0)
                    488:                                continue;
1.20      schwarze  489:                        break;
1.83      schwarze  490:                case ESCAPE_SPECIAL:
1.89      schwarze  491:                        if (p->enc == TERMENC_ASCII) {
1.114     schwarze  492:                                cp = mchars_spec2str(seq, sz, &ssz);
1.92      schwarze  493:                                if (cp != NULL)
1.89      schwarze  494:                                        encode(p, cp, ssz);
                    495:                        } else {
1.114     schwarze  496:                                uc = mchars_spec2cp(seq, sz);
1.90      schwarze  497:                                if (uc > 0)
                    498:                                        encode1(p, uc);
1.89      schwarze  499:                        }
1.93      schwarze  500:                        continue;
1.83      schwarze  501:                case ESCAPE_FONTBOLD:
1.20      schwarze  502:                        term_fontrepl(p, TERMFONT_BOLD);
1.93      schwarze  503:                        continue;
1.83      schwarze  504:                case ESCAPE_FONTITALIC:
1.20      schwarze  505:                        term_fontrepl(p, TERMFONT_UNDER);
1.93      schwarze  506:                        continue;
1.83      schwarze  507:                case ESCAPE_FONTBI:
1.70      schwarze  508:                        term_fontrepl(p, TERMFONT_BI);
1.93      schwarze  509:                        continue;
1.83      schwarze  510:                case ESCAPE_FONT:
                    511:                case ESCAPE_FONTROMAN:
1.20      schwarze  512:                        term_fontrepl(p, TERMFONT_NONE);
1.93      schwarze  513:                        continue;
1.83      schwarze  514:                case ESCAPE_FONTPREV:
1.20      schwarze  515:                        term_fontlast(p);
1.130   ! schwarze  516:                        continue;
        !           517:                case ESCAPE_BREAK:
        !           518:                        bufferc(p, '\n');
1.93      schwarze  519:                        continue;
1.83      schwarze  520:                case ESCAPE_NOSPACE:
1.108     schwarze  521:                        if (p->flags & TERMP_BACKAFTER)
                    522:                                p->flags &= ~TERMP_BACKAFTER;
                    523:                        else if (*word == '\0')
1.97      schwarze  524:                                p->flags |= (TERMP_NOSPACE | TERMP_NONEWLINE);
1.121     schwarze  525:                        continue;
                    526:                case ESCAPE_HORIZ:
1.128     schwarze  527:                        if (a2roffsu(seq, &su, SCALE_EM) == NULL)
1.121     schwarze  528:                                continue;
                    529:                        uc = term_hspan(p, &su) / 24;
                    530:                        if (uc > 0)
                    531:                                while (uc-- > 0)
                    532:                                        bufferc(p, ASCII_NBRSP);
                    533:                        else if (p->col > (size_t)(-uc))
                    534:                                p->col += uc;
                    535:                        else {
                    536:                                uc += p->col;
                    537:                                p->col = 0;
1.126     schwarze  538:                                if (p->tcol->offset > (size_t)(-uc)) {
1.121     schwarze  539:                                        p->ti += uc;
1.126     schwarze  540:                                        p->tcol->offset += uc;
1.121     schwarze  541:                                } else {
1.126     schwarze  542:                                        p->ti -= p->tcol->offset;
                    543:                                        p->tcol->offset = 0;
1.121     schwarze  544:                                }
1.122     schwarze  545:                        }
                    546:                        continue;
                    547:                case ESCAPE_HLINE:
1.128     schwarze  548:                        if ((seq = a2roffsu(seq, &su, SCALE_EM)) == NULL)
1.122     schwarze  549:                                continue;
                    550:                        uc = term_hspan(p, &su) / 24;
                    551:                        if (uc <= 0) {
1.126     schwarze  552:                                if (p->tcol->rmargin <= p->tcol->offset)
1.122     schwarze  553:                                        continue;
1.126     schwarze  554:                                lsz = p->tcol->rmargin - p->tcol->offset;
1.122     schwarze  555:                        } else
                    556:                                lsz = uc;
1.128     schwarze  557:                        if (*seq == '\0')
1.122     schwarze  558:                                uc = -1;
                    559:                        else if (*seq == '\\') {
                    560:                                seq++;
                    561:                                esc = mandoc_escape(&seq, &cp, &sz);
                    562:                                switch (esc) {
                    563:                                case ESCAPE_UNICODE:
                    564:                                        uc = mchars_num2uc(cp + 1, sz - 1);
                    565:                                        break;
                    566:                                case ESCAPE_NUMBERED:
                    567:                                        uc = mchars_num2char(cp, sz);
                    568:                                        break;
                    569:                                case ESCAPE_SPECIAL:
                    570:                                        uc = mchars_spec2cp(cp, sz);
                    571:                                        break;
                    572:                                default:
                    573:                                        uc = -1;
                    574:                                        break;
                    575:                                }
                    576:                        } else
                    577:                                uc = *seq;
                    578:                        if (uc < 0x20 || (uc > 0x7E && uc < 0xA0))
                    579:                                uc = '_';
                    580:                        if (p->enc == TERMENC_ASCII) {
                    581:                                cp = ascii_uc2str(uc);
                    582:                                csz = term_strlen(p, cp);
                    583:                                ssz = strlen(cp);
                    584:                        } else
                    585:                                csz = (*p->width)(p, uc);
                    586:                        while (lsz >= csz) {
                    587:                                if (p->enc == TERMENC_ASCII)
                    588:                                        encode(p, cp, ssz);
                    589:                                else
                    590:                                        encode1(p, uc);
                    591:                                lsz -= csz;
1.121     schwarze  592:                        }
1.93      schwarze  593:                        continue;
1.83      schwarze  594:                case ESCAPE_SKIPCHAR:
1.108     schwarze  595:                        p->flags |= TERMP_BACKAFTER;
1.93      schwarze  596:                        continue;
1.103     schwarze  597:                case ESCAPE_OVERSTRIKE:
                    598:                        cp = seq + sz;
                    599:                        while (seq < cp) {
                    600:                                if (*seq == '\\') {
                    601:                                        mandoc_escape(&seq, NULL, NULL);
                    602:                                        continue;
                    603:                                }
                    604:                                encode1(p, *seq++);
1.108     schwarze  605:                                if (seq < cp) {
                    606:                                        if (p->flags & TERMP_BACKBEFORE)
                    607:                                                p->flags |= TERMP_BACKAFTER;
                    608:                                        else
                    609:                                                p->flags |= TERMP_BACKBEFORE;
                    610:                                }
1.103     schwarze  611:                        }
1.109     schwarze  612:                        /* Trim trailing backspace/blank pair. */
1.129     schwarze  613:                        if (p->tcol->lastcol > 2 &&
                    614:                            (p->tcol->buf[p->tcol->lastcol - 1] == ' ' ||
                    615:                             p->tcol->buf[p->tcol->lastcol - 1] == '\t'))
                    616:                                p->tcol->lastcol -= 2;
                    617:                        if (p->col > p->tcol->lastcol)
                    618:                                p->col = p->tcol->lastcol;
1.108     schwarze  619:                        continue;
1.20      schwarze  620:                default:
1.93      schwarze  621:                        continue;
                    622:                }
                    623:
                    624:                /*
                    625:                 * Common handling for Unicode and numbered
                    626:                 * character escape sequences.
                    627:                 */
                    628:
                    629:                if (p->enc == TERMENC_ASCII) {
                    630:                        cp = ascii_uc2str(uc);
                    631:                        encode(p, cp, strlen(cp));
                    632:                } else {
                    633:                        if ((uc < 0x20 && uc != 0x09) ||
                    634:                            (uc > 0x7E && uc < 0xA0))
                    635:                                uc = 0xFFFD;
                    636:                        encode1(p, uc);
1.20      schwarze  637:                }
                    638:        }
1.75      schwarze  639:        p->flags &= ~TERMP_NBRWORD;
1.1       kristaps  640: }
                    641:
                    642: static void
1.126     schwarze  643: adjbuf(struct termp_col *c, size_t sz)
1.1       kristaps  644: {
1.126     schwarze  645:        if (c->maxcols == 0)
                    646:                c->maxcols = 1024;
                    647:        while (c->maxcols <= sz)
                    648:                c->maxcols <<= 2;
                    649:        c->buf = mandoc_reallocarray(c->buf, c->maxcols, sizeof(*c->buf));
1.1       kristaps  650: }
                    651:
1.4       schwarze  652: static void
1.20      schwarze  653: bufferc(struct termp *p, char c)
                    654: {
1.124     schwarze  655:        if (p->flags & TERMP_NOBUF) {
                    656:                (*p->letter)(p, c);
                    657:                return;
                    658:        }
1.126     schwarze  659:        if (p->col + 1 >= p->tcol->maxcols)
                    660:                adjbuf(p->tcol, p->col + 1);
1.129     schwarze  661:        if (p->tcol->lastcol <= p->col || (c != ' ' && c != ASCII_NBRSP))
1.126     schwarze  662:                p->tcol->buf[p->col] = c;
1.129     schwarze  663:        if (p->tcol->lastcol < ++p->col)
                    664:                p->tcol->lastcol = p->col;
1.20      schwarze  665: }
                    666:
1.59      schwarze  667: /*
                    668:  * See encode().
                    669:  * Do this for a single (probably unicode) value.
                    670:  * Does not check for non-decorated glyphs.
                    671:  */
                    672: static void
                    673: encode1(struct termp *p, int c)
                    674: {
                    675:        enum termfont     f;
                    676:
1.124     schwarze  677:        if (p->flags & TERMP_NOBUF) {
                    678:                (*p->letter)(p, c);
                    679:                return;
                    680:        }
                    681:
1.126     schwarze  682:        if (p->col + 7 >= p->tcol->maxcols)
                    683:                adjbuf(p->tcol, p->col + 7);
1.59      schwarze  684:
1.115     schwarze  685:        f = (c == ASCII_HYPH || c > 127 || isgraph(c)) ?
1.108     schwarze  686:            p->fontq[p->fonti] : TERMFONT_NONE;
1.59      schwarze  687:
1.108     schwarze  688:        if (p->flags & TERMP_BACKBEFORE) {
1.126     schwarze  689:                if (p->tcol->buf[p->col - 1] == ' ' ||
                    690:                    p->tcol->buf[p->col - 1] == '\t')
1.109     schwarze  691:                        p->col--;
                    692:                else
1.126     schwarze  693:                        p->tcol->buf[p->col++] = '\b';
1.108     schwarze  694:                p->flags &= ~TERMP_BACKBEFORE;
                    695:        }
1.126     schwarze  696:        if (f == TERMFONT_UNDER || f == TERMFONT_BI) {
                    697:                p->tcol->buf[p->col++] = '_';
                    698:                p->tcol->buf[p->col++] = '\b';
                    699:        }
                    700:        if (f == TERMFONT_BOLD || f == TERMFONT_BI) {
                    701:                if (c == ASCII_HYPH)
                    702:                        p->tcol->buf[p->col++] = '-';
1.70      schwarze  703:                else
1.126     schwarze  704:                        p->tcol->buf[p->col++] = c;
                    705:                p->tcol->buf[p->col++] = '\b';
1.70      schwarze  706:        }
1.129     schwarze  707:        if (p->tcol->lastcol <= p->col || (c != ' ' && c != ASCII_NBRSP))
1.126     schwarze  708:                p->tcol->buf[p->col] = c;
1.129     schwarze  709:        if (p->tcol->lastcol < ++p->col)
                    710:                p->tcol->lastcol = p->col;
1.108     schwarze  711:        if (p->flags & TERMP_BACKAFTER) {
                    712:                p->flags |= TERMP_BACKBEFORE;
                    713:                p->flags &= ~TERMP_BACKAFTER;
                    714:        }
1.59      schwarze  715: }
1.20      schwarze  716:
                    717: static void
                    718: encode(struct termp *p, const char *word, size_t sz)
1.4       schwarze  719: {
1.71      schwarze  720:        size_t            i;
1.124     schwarze  721:
                    722:        if (p->flags & TERMP_NOBUF) {
                    723:                for (i = 0; i < sz; i++)
                    724:                        (*p->letter)(p, word[i]);
                    725:                return;
                    726:        }
1.59      schwarze  727:
1.126     schwarze  728:        if (p->col + 2 + (sz * 5) >= p->tcol->maxcols)
                    729:                adjbuf(p->tcol, p->col + 2 + (sz * 5));
1.46      schwarze  730:
1.71      schwarze  731:        for (i = 0; i < sz; i++) {
1.70      schwarze  732:                if (ASCII_HYPH == word[i] ||
                    733:                    isgraph((unsigned char)word[i]))
                    734:                        encode1(p, word[i]);
1.119     schwarze  735:                else {
1.129     schwarze  736:                        if (p->tcol->lastcol <= p->col ||
1.125     schwarze  737:                            (word[i] != ' ' && word[i] != ASCII_NBRSP))
1.126     schwarze  738:                                p->tcol->buf[p->col] = word[i];
1.125     schwarze  739:                        p->col++;
1.119     schwarze  740:
                    741:                        /*
                    742:                         * Postpone the effect of \z while handling
                    743:                         * an overstrike sequence from ascii_uc2str().
                    744:                         */
                    745:
                    746:                        if (word[i] == '\b' &&
                    747:                            (p->flags & TERMP_BACKBEFORE)) {
                    748:                                p->flags &= ~TERMP_BACKBEFORE;
                    749:                                p->flags |= TERMP_BACKAFTER;
                    750:                        }
                    751:                }
1.4       schwarze  752:        }
1.129     schwarze  753:        if (p->tcol->lastcol < p->col)
                    754:                p->tcol->lastcol = p->col;
1.80      schwarze  755: }
                    756:
                    757: void
                    758: term_setwidth(struct termp *p, const char *wstr)
                    759: {
                    760:        struct roffsu    su;
1.107     schwarze  761:        int              iop, width;
1.80      schwarze  762:
1.81      schwarze  763:        iop = 0;
                    764:        width = 0;
1.80      schwarze  765:        if (NULL != wstr) {
                    766:                switch (*wstr) {
1.83      schwarze  767:                case '+':
1.80      schwarze  768:                        iop = 1;
                    769:                        wstr++;
                    770:                        break;
1.83      schwarze  771:                case '-':
1.80      schwarze  772:                        iop = -1;
                    773:                        wstr++;
                    774:                        break;
                    775:                default:
                    776:                        break;
                    777:                }
1.128     schwarze  778:                if (a2roffsu(wstr, &su, SCALE_MAX) != NULL)
1.81      schwarze  779:                        width = term_hspan(p, &su);
                    780:                else
1.80      schwarze  781:                        iop = 0;
                    782:        }
                    783:        (*p->setwidth)(p, iop, width);
1.4       schwarze  784: }
1.16      schwarze  785:
                    786: size_t
1.39      schwarze  787: term_len(const struct termp *p, size_t sz)
                    788: {
                    789:
1.112     schwarze  790:        return (*p->width)(p, ' ') * sz;
1.39      schwarze  791: }
                    792:
1.64      schwarze  793: static size_t
                    794: cond_width(const struct termp *p, int c, int *skip)
                    795: {
                    796:
                    797:        if (*skip) {
                    798:                (*skip) = 0;
1.112     schwarze  799:                return 0;
1.64      schwarze  800:        } else
1.112     schwarze  801:                return (*p->width)(p, c);
1.64      schwarze  802: }
1.39      schwarze  803:
                    804: size_t
                    805: term_strlen(const struct termp *p, const char *cp)
                    806: {
1.59      schwarze  807:        size_t           sz, rsz, i;
1.93      schwarze  808:        int              ssz, skip, uc;
1.50      schwarze  809:        const char      *seq, *rhs;
1.59      schwarze  810:        enum mandoc_esc  esc;
1.77      schwarze  811:        static const char rej[] = { '\\', ASCII_NBRSP, ASCII_HYPH,
                    812:                        ASCII_BREAK, '\0' };
1.59      schwarze  813:
                    814:        /*
                    815:         * Account for escaped sequences within string length
                    816:         * calculations.  This follows the logic in term_word() as we
                    817:         * must calculate the width of produced strings.
                    818:         */
                    819:
                    820:        sz = 0;
1.64      schwarze  821:        skip = 0;
1.59      schwarze  822:        while ('\0' != *cp) {
                    823:                rsz = strcspn(cp, rej);
                    824:                for (i = 0; i < rsz; i++)
1.64      schwarze  825:                        sz += cond_width(p, *cp++, &skip);
1.59      schwarze  826:
                    827:                switch (*cp) {
1.83      schwarze  828:                case '\\':
1.59      schwarze  829:                        cp++;
                    830:                        esc = mandoc_escape(&cp, &seq, &ssz);
                    831:                        if (ESCAPE_ERROR == esc)
1.85      schwarze  832:                                continue;
1.59      schwarze  833:
                    834:                        rhs = NULL;
1.50      schwarze  835:
1.59      schwarze  836:                        switch (esc) {
1.83      schwarze  837:                        case ESCAPE_UNICODE:
1.94      schwarze  838:                                uc = mchars_num2uc(seq + 1, ssz - 1);
1.59      schwarze  839:                                break;
1.83      schwarze  840:                        case ESCAPE_NUMBERED:
1.93      schwarze  841:                                uc = mchars_num2char(seq, ssz);
                    842:                                if (uc < 0)
                    843:                                        continue;
1.50      schwarze  844:                                break;
1.83      schwarze  845:                        case ESCAPE_SPECIAL:
1.93      schwarze  846:                                if (p->enc == TERMENC_ASCII) {
1.114     schwarze  847:                                        rhs = mchars_spec2str(seq, ssz, &rsz);
1.93      schwarze  848:                                        if (rhs != NULL)
                    849:                                                break;
                    850:                                } else {
1.114     schwarze  851:                                        uc = mchars_spec2cp(seq, ssz);
1.93      schwarze  852:                                        if (uc > 0)
                    853:                                                sz += cond_width(p, uc, &skip);
1.89      schwarze  854:                                }
1.93      schwarze  855:                                continue;
1.83      schwarze  856:                        case ESCAPE_SKIPCHAR:
1.64      schwarze  857:                                skip = 1;
1.103     schwarze  858:                                continue;
                    859:                        case ESCAPE_OVERSTRIKE:
                    860:                                rsz = 0;
                    861:                                rhs = seq + ssz;
                    862:                                while (seq < rhs) {
                    863:                                        if (*seq == '\\') {
                    864:                                                mandoc_escape(&seq, NULL, NULL);
                    865:                                                continue;
                    866:                                        }
                    867:                                        i = (*p->width)(p, *seq++);
                    868:                                        if (rsz < i)
                    869:                                                rsz = i;
                    870:                                }
                    871:                                sz += rsz;
1.93      schwarze  872:                                continue;
1.50      schwarze  873:                        default:
1.93      schwarze  874:                                continue;
1.50      schwarze  875:                        }
1.39      schwarze  876:
1.93      schwarze  877:                        /*
                    878:                         * Common handling for Unicode and numbered
                    879:                         * character escape sequences.
                    880:                         */
                    881:
                    882:                        if (rhs == NULL) {
                    883:                                if (p->enc == TERMENC_ASCII) {
                    884:                                        rhs = ascii_uc2str(uc);
                    885:                                        rsz = strlen(rhs);
                    886:                                } else {
                    887:                                        if ((uc < 0x20 && uc != 0x09) ||
                    888:                                            (uc > 0x7E && uc < 0xA0))
                    889:                                                uc = 0xFFFD;
                    890:                                        sz += cond_width(p, uc, &skip);
                    891:                                        continue;
                    892:                                }
                    893:                        }
1.59      schwarze  894:
1.64      schwarze  895:                        if (skip) {
                    896:                                skip = 0;
                    897:                                break;
                    898:                        }
1.93      schwarze  899:
                    900:                        /*
                    901:                         * Common handling for all escape sequences
                    902:                         * printing more than one character.
                    903:                         */
1.64      schwarze  904:
1.59      schwarze  905:                        for (i = 0; i < rsz; i++)
                    906:                                sz += (*p->width)(p, *rhs++);
                    907:                        break;
1.83      schwarze  908:                case ASCII_NBRSP:
1.64      schwarze  909:                        sz += cond_width(p, ' ', &skip);
1.55      schwarze  910:                        cp++;
1.59      schwarze  911:                        break;
1.83      schwarze  912:                case ASCII_HYPH:
1.64      schwarze  913:                        sz += cond_width(p, '-', &skip);
1.55      schwarze  914:                        cp++;
1.59      schwarze  915:                        break;
                    916:                default:
                    917:                        break;
                    918:                }
                    919:        }
1.39      schwarze  920:
1.112     schwarze  921:        return sz;
1.39      schwarze  922: }
                    923:
1.100     schwarze  924: int
1.39      schwarze  925: term_vspan(const struct termp *p, const struct roffsu *su)
1.16      schwarze  926: {
                    927:        double           r;
1.101     schwarze  928:        int              ri;
1.16      schwarze  929:
                    930:        switch (su->unit) {
1.99      schwarze  931:        case SCALE_BU:
                    932:                r = su->scale / 40.0;
                    933:                break;
1.83      schwarze  934:        case SCALE_CM:
1.99      schwarze  935:                r = su->scale * 6.0 / 2.54;
                    936:                break;
                    937:        case SCALE_FS:
                    938:                r = su->scale * 65536.0 / 40.0;
1.16      schwarze  939:                break;
1.83      schwarze  940:        case SCALE_IN:
1.86      schwarze  941:                r = su->scale * 6.0;
1.16      schwarze  942:                break;
1.99      schwarze  943:        case SCALE_MM:
                    944:                r = su->scale * 0.006;
                    945:                break;
1.83      schwarze  946:        case SCALE_PC:
1.16      schwarze  947:                r = su->scale;
                    948:                break;
1.83      schwarze  949:        case SCALE_PT:
1.99      schwarze  950:                r = su->scale / 12.0;
1.16      schwarze  951:                break;
1.99      schwarze  952:        case SCALE_EN:
                    953:        case SCALE_EM:
                    954:                r = su->scale * 0.6;
1.16      schwarze  955:                break;
1.83      schwarze  956:        case SCALE_VS:
1.16      schwarze  957:                r = su->scale;
                    958:                break;
                    959:        default:
1.99      schwarze  960:                abort();
1.16      schwarze  961:        }
1.101     schwarze  962:        ri = r > 0.0 ? r + 0.4995 : r - 0.4995;
1.112     schwarze  963:        return ri < 66 ? ri : 1;
1.16      schwarze  964: }
                    965:
1.107     schwarze  966: /*
                    967:  * Convert a scaling width to basic units, rounding down.
                    968:  */
1.100     schwarze  969: int
1.39      schwarze  970: term_hspan(const struct termp *p, const struct roffsu *su)
1.16      schwarze  971: {
                    972:
1.112     schwarze  973:        return (*p->hspan)(p, su);
1.16      schwarze  974: }