src/usr.bin/mandoc/term.c - annotate

Return to term.c CVS log
Up to [local] / src / usr.bin / mandoc
Annotation of src/usr.bin/mandoc/term.c, Revision 1.135

1.135   ! schwarze    1: /*     $OpenBSD: term.c,v 1.134 2017/07/28 14:24:17 florian Exp $ */
1.1       kristaps    2: /*
1.59      schwarze    3:  * Copyright (c) 2008, 2009, 2010, 2011 Kristaps Dzonsons <kristaps@bsd.lv>
1.135   ! schwarze    4:  * Copyright (c) 2010-2018 Ingo Schwarze <schwarze@openbsd.org>
1.1       kristaps    5:  *
                      6:  * Permission to use, copy, modify, and distribute this software for any
1.2       schwarze    7:  * purpose with or without fee is hereby granted, provided that the above
                      8:  * copyright notice and this permission notice appear in all copies.
1.1       kristaps    9:  *
1.106     schwarze   10:  * THE SOFTWARE IS PROVIDED "AS IS" AND THE AUTHORS DISCLAIM ALL WARRANTIES
1.2       schwarze   11:  * WITH REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED WARRANTIES OF
1.106     schwarze   12:  * MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL THE AUTHORS BE LIABLE FOR
1.2       schwarze   13:  * ANY SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL DAMAGES OR ANY DAMAGES
                     14:  * WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN
                     15:  * ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF
                     16:  * OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.
1.1       kristaps   17:  */
1.20      schwarze   18: #include <sys/types.h>
                     19:
1.1       kristaps   20: #include <assert.h>
1.20      schwarze   21: #include <ctype.h>
1.1       kristaps   22: #include <stdio.h>
                     23: #include <stdlib.h>
                     24: #include <string.h>
                     25:
1.34      schwarze   26: #include "mandoc.h"
1.79      schwarze   27: #include "mandoc_aux.h"
1.16      schwarze   28: #include "out.h"
1.1       kristaps   29: #include "term.h"
1.16      schwarze   30: #include "main.h"
1.1       kristaps   31:
1.64      schwarze   32: static size_t           cond_width(const struct termp *, int, int *);
1.126     schwarze   33: static void             adjbuf(struct termp_col *, size_t);
1.59      schwarze   34: static void             bufferc(struct termp *, char);
                     35: static void             encode(struct termp *, const char *, size_t);
                     36: static void             encode1(struct termp *, int);
1.124     schwarze   37: static void             endline(struct termp *);
1.1       kristaps   38:
1.83      schwarze   39:
1.37      schwarze   40: void
1.129     schwarze   41: term_setcol(struct termp *p, size_t maxtcol)
                     42: {
                     43:        if (maxtcol > p->maxtcol) {
                     44:                p->tcols = mandoc_recallocarray(p->tcols,
                     45:                    p->maxtcol, maxtcol, sizeof(*p->tcols));
                     46:                p->maxtcol = maxtcol;
                     47:        }
                     48:        p->lasttcol = maxtcol - 1;
                     49:        p->tcol = p->tcols;
                     50: }
                     51:
                     52: void
1.37      schwarze   53: term_free(struct termp *p)
1.1       kristaps   54: {
1.126     schwarze   55:        for (p->tcol = p->tcols; p->tcol < p->tcols + p->maxtcol; p->tcol++)
                     56:                free(p->tcol->buf);
                     57:        free(p->tcols);
1.98      schwarze   58:        free(p->fontq);
1.37      schwarze   59:        free(p);
1.1       kristaps   60: }
                     61:
1.13      schwarze   62: void
1.83      schwarze   63: term_begin(struct termp *p, term_margin head,
1.106     schwarze   64:                term_margin foot, const struct roff_meta *arg)
1.1       kristaps   65: {
                     66:
1.37      schwarze   67:        p->headf = head;
                     68:        p->footf = foot;
                     69:        p->argf = arg;
                     70:        (*p->begin)(p);
1.1       kristaps   71: }
                     72:
1.37      schwarze   73: void
                     74: term_end(struct termp *p)
1.1       kristaps   75: {
                     76:
1.37      schwarze   77:        (*p->end)(p);
1.1       kristaps   78: }
                     79:
                     80: /*
1.82      schwarze   81:  * Flush a chunk of text.  By default, break the output line each time
                     82:  * the right margin is reached, and continue output on the next line
                     83:  * at the same offset as the chunk itself.  By default, also break the
                     84:  * output line at the end of the chunk.
1.27      schwarze   85:  * The following flags may be specified:
1.1       kristaps   86:  *
1.82      schwarze   87:  *  - TERMP_NOBREAK: Do not break the output line at the right margin,
                     88:  *    but only at the max right margin.  Also, do not break the output
                     89:  *    line at the end of the chunk, such that the next call can pad to
                     90:  *    the next column.  However, if less than p->trailspace blanks,
                     91:  *    which can be 0, 1, or 2, remain to the right margin, the line
                     92:  *    will be broken.
1.110     schwarze   93:  *  - TERMP_BRTRSP: Consider trailing whitespace significant
                     94:  *    when deciding whether the chunk fits or not.
1.82      schwarze   95:  *  - TERMP_BRIND: If the chunk does not fit and the output line has
                     96:  *    to be broken, start the next line at the right margin instead
                     97:  *    of at the offset.  Used together with TERMP_NOBREAK for the tags
                     98:  *    in various kinds of tagged lists.
1.123     schwarze   99:  *  - TERMP_HANG: Do not break the output line at the right margin,
1.82      schwarze  100:  *    append the next chunk after it even if this one is too long.
                    101:  *    To be used together with TERMP_NOBREAK.
1.123     schwarze  102:  *  - TERMP_NOPAD: Start writing at the current position,
                    103:  *    do not pad with blank characters up to the offset.
1.1       kristaps  104:  */
                    105: void
                    106: term_flushln(struct termp *p)
                    107: {
1.19      schwarze  108:        size_t           vis;   /* current visual position on output */
                    109:        size_t           vbl;   /* number of blanks to prepend to output */
1.33      schwarze  110:        size_t           vend;  /* end of word visual position on output */
1.19      schwarze  111:        size_t           bp;    /* visual right border position */
1.51      schwarze  112:        size_t           dv;    /* temporary for visual pos calculations */
1.126     schwarze  113:        size_t           j;     /* temporary loop index for p->tcol->buf */
1.71      schwarze  114:        size_t           jhy;   /* last hyph before overflow w/r/t j */
1.42      schwarze  115:        size_t           maxvis; /* output position of visible boundary */
1.126     schwarze  116:        int              ntab;  /* number of tabs to prepend */
1.130     schwarze  117:        int              breakline; /* after this word */
1.1       kristaps  118:
1.126     schwarze  119:        vbl = (p->flags & TERMP_NOPAD) || p->tcol->offset < p->viscol ?
                    120:            0 : p->tcol->offset - p->viscol;
1.123     schwarze  121:        if (p->minbl && vbl < p->minbl)
                    122:                vbl = p->minbl;
1.126     schwarze  123:        maxvis = p->tcol->rmargin > p->viscol + vbl ?
                    124:            p->tcol->rmargin - p->viscol - vbl : 0;
1.123     schwarze  125:        bp = !(p->flags & TERMP_NOBREAK) ? maxvis :
                    126:            p->maxrmargin > p->viscol + vbl ?
                    127:            p->maxrmargin - p->viscol - vbl : 0;
1.53      schwarze  128:        vis = vend = 0;
1.19      schwarze  129:
1.134     florian   130:        if ((p->flags & TERMP_MULTICOL) == 0)
1.127     schwarze  131:                p->tcol->col = 0;
1.129     schwarze  132:        while (p->tcol->col < p->tcol->lastcol) {
1.127     schwarze  133:
1.22      schwarze  134:                /*
1.42      schwarze  135:                 * Handle literal tab characters: collapse all
                    136:                 * subsequent tabs into a single huge set of spaces.
1.30      schwarze  137:                 */
1.127     schwarze  138:
1.66      schwarze  139:                ntab = 0;
1.129     schwarze  140:                while (p->tcol->col < p->tcol->lastcol &&
1.127     schwarze  141:                    p->tcol->buf[p->tcol->col] == '\t') {
1.120     schwarze  142:                        vend = term_tab_next(vis);
1.30      schwarze  143:                        vbl += vend - vis;
                    144:                        vis = vend;
1.66      schwarze  145:                        ntab++;
1.127     schwarze  146:                        p->tcol->col++;
1.30      schwarze  147:                }
1.22      schwarze  148:
1.1       kristaps  149:                /*
                    150:                 * Count up visible word characters.  Control sequences
                    151:                 * (starting with the CSI) aren't counted.  A space
                    152:                 * generates a non-printing word, which is valid (the
                    153:                 * space is printed according to regular spacing rules).
                    154:                 */
                    155:
1.127     schwarze  156:                jhy = 0;
1.130     schwarze  157:                breakline = 0;
1.129     schwarze  158:                for (j = p->tcol->col; j < p->tcol->lastcol; j++) {
1.130     schwarze  159:                        if (p->tcol->buf[j] == '\n') {
                    160:                                if ((p->flags & TERMP_BRIND) == 0)
                    161:                                        breakline = 1;
                    162:                                continue;
                    163:                        }
1.126     schwarze  164:                        if (p->tcol->buf[j] == ' ' || p->tcol->buf[j] == '\t')
1.1       kristaps  165:                                break;
1.42      schwarze  166:
1.117     krw       167:                        /* Back over the last printed character. */
1.126     schwarze  168:                        if (p->tcol->buf[j] == '\b') {
1.42      schwarze  169:                                assert(j);
1.126     schwarze  170:                                vend -= (*p->width)(p, p->tcol->buf[j - 1]);
1.42      schwarze  171:                                continue;
                    172:                        }
                    173:
                    174:                        /* Regular word. */
                    175:                        /* Break at the hyphen point if we overrun. */
1.83      schwarze  176:                        if (vend > vis && vend < bp &&
1.126     schwarze  177:                            (p->tcol->buf[j] == ASCII_HYPH||
                    178:                             p->tcol->buf[j] == ASCII_BREAK))
1.42      schwarze  179:                                jhy = j;
                    180:
1.78      schwarze  181:                        /*
                    182:                         * Hyphenation now decided, put back a real
                    183:                         * hyphen such that we get the correct width.
                    184:                         */
1.126     schwarze  185:                        if (p->tcol->buf[j] == ASCII_HYPH)
                    186:                                p->tcol->buf[j] = '-';
1.78      schwarze  187:
1.126     schwarze  188:                        vend += (*p->width)(p, p->tcol->buf[j]);
1.1       kristaps  189:                }
                    190:
                    191:                /*
1.5       schwarze  192:                 * Find out whether we would exceed the right margin.
1.33      schwarze  193:                 * If so, break to the next line.
1.5       schwarze  194:                 */
1.127     schwarze  195:
                    196:                if (vend > bp && jhy == 0 && vis > 0 &&
1.124     schwarze  197:                    (p->flags & TERMP_BRNEVER) == 0) {
1.129     schwarze  198:                        if (p->flags & TERMP_MULTICOL)
1.127     schwarze  199:                                return;
                    200:
                    201:                        endline(p);
1.22      schwarze  202:                        vend -= vis;
1.66      schwarze  203:
1.120     schwarze  204:                        /* Use pending tabs on the new line. */
                    205:
                    206:                        vbl = 0;
                    207:                        while (ntab--)
                    208:                                vbl = term_tab_next(vbl);
                    209:
                    210:                        /* Re-establish indentation. */
1.66      schwarze  211:
1.123     schwarze  212:                        if (p->flags & TERMP_BRIND)
1.126     schwarze  213:                                vbl += p->tcol->rmargin;
1.123     schwarze  214:                        else
1.126     schwarze  215:                                vbl += p->tcol->offset;
                    216:                        maxvis = p->tcol->rmargin > vbl ?
                    217:                            p->tcol->rmargin - vbl : 0;
1.123     schwarze  218:                        bp = !(p->flags & TERMP_NOBREAK) ? maxvis :
                    219:                            p->maxrmargin > vbl ?  p->maxrmargin - vbl : 0;
1.1       kristaps  220:                }
1.30      schwarze  221:
1.127     schwarze  222:                /*
                    223:                 * Write out the rest of the word.
                    224:                 */
                    225:
1.129     schwarze  226:                for ( ; p->tcol->col < p->tcol->lastcol; p->tcol->col++) {
1.127     schwarze  227:                        if (vend > bp && jhy > 0 && p->tcol->col > jhy)
1.30      schwarze  228:                                break;
1.130     schwarze  229:                        if (p->tcol->buf[p->tcol->col] == '\n')
                    230:                                continue;
1.127     schwarze  231:                        if (p->tcol->buf[p->tcol->col] == '\t')
1.1       kristaps  232:                                break;
1.127     schwarze  233:                        if (p->tcol->buf[p->tcol->col] == ' ') {
                    234:                                j = p->tcol->col;
1.129     schwarze  235:                                while (p->tcol->col < p->tcol->lastcol &&
1.127     schwarze  236:                                    p->tcol->buf[p->tcol->col] == ' ')
                    237:                                        p->tcol->col++;
                    238:                                dv = (p->tcol->col - j) * (*p->width)(p, ' ');
1.51      schwarze  239:                                vbl += dv;
                    240:                                vend += dv;
1.22      schwarze  241:                                break;
                    242:                        }
1.127     schwarze  243:                        if (p->tcol->buf[p->tcol->col] == ASCII_NBRSP) {
1.42      schwarze  244:                                vbl += (*p->width)(p, ' ');
1.33      schwarze  245:                                continue;
                    246:                        }
1.127     schwarze  247:                        if (p->tcol->buf[p->tcol->col] == ASCII_BREAK)
1.77      schwarze  248:                                continue;
1.33      schwarze  249:
                    250:                        /*
                    251:                         * Now we definitely know there will be
                    252:                         * printable characters to output,
                    253:                         * so write preceding white space now.
                    254:                         */
                    255:                        if (vbl) {
1.37      schwarze  256:                                (*p->advance)(p, vbl);
1.33      schwarze  257:                                p->viscol += vbl;
                    258:                                vbl = 0;
1.61      schwarze  259:                        }
                    260:
1.127     schwarze  261:                        (*p->letter)(p, p->tcol->buf[p->tcol->col]);
                    262:                        if (p->tcol->buf[p->tcol->col] == '\b')
                    263:                                p->viscol -= (*p->width)(p,
                    264:                                    p->tcol->buf[p->tcol->col - 1]);
1.83      schwarze  265:                        else
1.127     schwarze  266:                                p->viscol += (*p->width)(p,
                    267:                                    p->tcol->buf[p->tcol->col]);
1.1       kristaps  268:                }
1.22      schwarze  269:                vis = vend;
1.130     schwarze  270:
                    271:                if (breakline == 0)
                    272:                        continue;
                    273:
                    274:                /* Explicitly requested output line break. */
                    275:
                    276:                if (p->flags & TERMP_MULTICOL)
                    277:                        return;
                    278:
                    279:                endline(p);
                    280:                breakline = 0;
                    281:                vis = vend = 0;
                    282:
                    283:                /* Re-establish indentation. */
                    284:
                    285:                vbl = p->tcol->offset;
                    286:                maxvis = p->tcol->rmargin > vbl ?
                    287:                    p->tcol->rmargin - vbl : 0;
                    288:                bp = !(p->flags & TERMP_NOBREAK) ? maxvis :
                    289:                    p->maxrmargin > vbl ?  p->maxrmargin - vbl : 0;
1.1       kristaps  290:        }
1.48      schwarze  291:
                    292:        /*
                    293:         * If there was trailing white space, it was not printed;
                    294:         * so reset the cursor position accordingly.
                    295:         */
1.127     schwarze  296:
1.95      schwarze  297:        if (vis > vbl)
1.61      schwarze  298:                vis -= vbl;
1.95      schwarze  299:        else
                    300:                vis = 0;
1.18      schwarze  301:
1.129     schwarze  302:        p->col = p->tcol->col = p->tcol->lastcol = 0;
1.124     schwarze  303:        p->minbl = p->trailspace;
1.123     schwarze  304:        p->flags &= ~(TERMP_BACKAFTER | TERMP_BACKBEFORE | TERMP_NOPAD);
1.1       kristaps  305:
1.129     schwarze  306:        if (p->flags & TERMP_MULTICOL)
                    307:                return;
                    308:
1.110     schwarze  309:        /* Trailing whitespace is significant in some columns. */
1.127     schwarze  310:
1.110     schwarze  311:        if (vis && vbl && (TERMP_BRTRSP & p->flags))
                    312:                vis += vbl;
1.1       kristaps  313:
1.61      schwarze  314:        /* If the column was overrun, break the line. */
1.124     schwarze  315:        if ((p->flags & TERMP_NOBREAK) == 0 ||
                    316:            ((p->flags & TERMP_HANG) == 0 &&
                    317:             vis + p->trailspace * (*p->width)(p, ' ') > maxvis))
                    318:                endline(p);
                    319: }
                    320:
                    321: static void
                    322: endline(struct termp *p)
                    323: {
                    324:        if ((p->flags & (TERMP_NEWMC | TERMP_ENDMC)) == TERMP_ENDMC) {
                    325:                p->mc = NULL;
                    326:                p->flags &= ~TERMP_ENDMC;
                    327:        }
                    328:        if (p->mc != NULL) {
                    329:                if (p->viscol && p->maxrmargin >= p->viscol)
                    330:                        (*p->advance)(p, p->maxrmargin - p->viscol + 1);
                    331:                p->flags |= TERMP_NOBUF | TERMP_NOSPACE;
                    332:                term_word(p, p->mc);
                    333:                p->flags &= ~(TERMP_NOBUF | TERMP_NEWMC);
                    334:        }
                    335:        p->viscol = 0;
                    336:        p->minbl = 0;
                    337:        (*p->endline)(p);
1.1       kristaps  338: }
                    339:
1.83      schwarze  340: /*
1.1       kristaps  341:  * A newline only breaks an existing line; it won't assert vertical
                    342:  * space.  All data in the output buffer is flushed prior to the newline
                    343:  * assertion.
                    344:  */
                    345: void
                    346: term_newln(struct termp *p)
                    347: {
                    348:
                    349:        p->flags |= TERMP_NOSPACE;
1.129     schwarze  350:        if (p->tcol->lastcol || p->viscol)
1.61      schwarze  351:                term_flushln(p);
1.1       kristaps  352: }
                    353:
                    354: /*
                    355:  * Asserts a vertical space (a full, empty line-break between lines).
                    356:  * Note that if used twice, this will cause two blank spaces and so on.
                    357:  * All data in the output buffer is flushed prior to the newline
                    358:  * assertion.
                    359:  */
                    360: void
                    361: term_vspace(struct termp *p)
                    362: {
                    363:
                    364:        term_newln(p);
1.29      schwarze  365:        p->viscol = 0;
1.124     schwarze  366:        p->minbl = 0;
1.63      schwarze  367:        if (0 < p->skipvsp)
                    368:                p->skipvsp--;
                    369:        else
                    370:                (*p->endline)(p);
1.1       kristaps  371: }
                    372:
1.98      schwarze  373: /* Swap current and previous font; for \fP and .ft P */
1.20      schwarze  374: void
                    375: term_fontlast(struct termp *p)
                    376: {
                    377:        enum termfont    f;
1.11      schwarze  378:
1.20      schwarze  379:        f = p->fontl;
                    380:        p->fontl = p->fontq[p->fonti];
                    381:        p->fontq[p->fonti] = f;
                    382: }
                    383:
1.98      schwarze  384: /* Set font, save current, discard previous; for \f, .ft, .B etc. */
1.20      schwarze  385: void
                    386: term_fontrepl(struct termp *p, enum termfont f)
                    387: {
                    388:
                    389:        p->fontl = p->fontq[p->fonti];
                    390:        p->fontq[p->fonti] = f;
1.1       kristaps  391: }
                    392:
1.98      schwarze  393: /* Set font, save previous. */
1.20      schwarze  394: void
                    395: term_fontpush(struct termp *p, enum termfont f)
1.1       kristaps  396: {
1.7       schwarze  397:
1.20      schwarze  398:        p->fontl = p->fontq[p->fonti];
1.98      schwarze  399:        if (++p->fonti == p->fontsz) {
                    400:                p->fontsz += 8;
                    401:                p->fontq = mandoc_reallocarray(p->fontq,
1.116     schwarze  402:                    p->fontsz, sizeof(*p->fontq));
1.98      schwarze  403:        }
                    404:        p->fontq[p->fonti] = f;
1.20      schwarze  405: }
1.1       kristaps  406:
1.98      schwarze  407: /* Flush to make the saved pointer current again. */
1.20      schwarze  408: void
1.104     schwarze  409: term_fontpopq(struct termp *p, int i)
1.20      schwarze  410: {
1.1       kristaps  411:
1.104     schwarze  412:        assert(i >= 0);
                    413:        if (p->fonti > i)
                    414:                p->fonti = i;
1.20      schwarze  415: }
1.1       kristaps  416:
1.98      schwarze  417: /* Pop one font off the stack. */
1.20      schwarze  418: void
                    419: term_fontpop(struct termp *p)
                    420: {
1.1       kristaps  421:
1.20      schwarze  422:        assert(p->fonti);
                    423:        p->fonti--;
1.1       kristaps  424: }
                    425:
                    426: /*
                    427:  * Handle pwords, partial words, which may be either a single word or a
                    428:  * phrase that cannot be broken down (such as a literal string).  This
                    429:  * handles word styling.
                    430:  */
1.7       schwarze  431: void
                    432: term_word(struct termp *p, const char *word)
1.1       kristaps  433: {
1.121     schwarze  434:        struct roffsu    su;
1.75      schwarze  435:        const char       nbrsp[2] = { ASCII_NBRSP, 0 };
1.59      schwarze  436:        const char      *seq, *cp;
                    437:        int              sz, uc;
1.122     schwarze  438:        size_t           csz, lsz, ssz;
1.59      schwarze  439:        enum mandoc_esc  esc;
1.1       kristaps  440:
1.124     schwarze  441:        if ((p->flags & TERMP_NOBUF) == 0) {
                    442:                if ((p->flags & TERMP_NOSPACE) == 0) {
                    443:                        if ((p->flags & TERMP_KEEP) == 0) {
1.40      schwarze  444:                                bufferc(p, ' ');
1.124     schwarze  445:                                if (p->flags & TERMP_SENTENCE)
                    446:                                        bufferc(p, ' ');
                    447:                        } else
                    448:                                bufferc(p, ASCII_NBRSP);
                    449:                }
                    450:                if (p->flags & TERMP_PREKEEP)
                    451:                        p->flags |= TERMP_KEEP;
                    452:                if (p->flags & TERMP_NONOSPACE)
                    453:                        p->flags |= TERMP_NOSPACE;
                    454:                else
                    455:                        p->flags &= ~TERMP_NOSPACE;
                    456:                p->flags &= ~(TERMP_SENTENCE | TERMP_NONEWLINE);
                    457:                p->skipvsp = 0;
1.31      schwarze  458:        }
                    459:
1.59      schwarze  460:        while ('\0' != *word) {
1.64      schwarze  461:                if ('\\' != *word) {
1.75      schwarze  462:                        if (TERMP_NBRWORD & p->flags) {
                    463:                                if (' ' == *word) {
                    464:                                        encode(p, nbrsp, 1);
                    465:                                        word++;
                    466:                                        continue;
                    467:                                }
                    468:                                ssz = strcspn(word, "\\ ");
                    469:                        } else
                    470:                                ssz = strcspn(word, "\\");
1.45      schwarze  471:                        encode(p, word, ssz);
1.64      schwarze  472:                        word += (int)ssz;
1.20      schwarze  473:                        continue;
1.64      schwarze  474:                }
1.20      schwarze  475:
1.59      schwarze  476:                word++;
                    477:                esc = mandoc_escape(&word, &seq, &sz);
                    478:                if (ESCAPE_ERROR == esc)
1.85      schwarze  479:                        continue;
1.59      schwarze  480:
                    481:                switch (esc) {
1.83      schwarze  482:                case ESCAPE_UNICODE:
1.89      schwarze  483:                        uc = mchars_num2uc(seq + 1, sz - 1);
1.56      schwarze  484:                        break;
1.83      schwarze  485:                case ESCAPE_NUMBERED:
1.93      schwarze  486:                        uc = mchars_num2char(seq, sz);
                    487:                        if (uc < 0)
                    488:                                continue;
1.20      schwarze  489:                        break;
1.83      schwarze  490:                case ESCAPE_SPECIAL:
1.89      schwarze  491:                        if (p->enc == TERMENC_ASCII) {
1.114     schwarze  492:                                cp = mchars_spec2str(seq, sz, &ssz);
1.92      schwarze  493:                                if (cp != NULL)
1.89      schwarze  494:                                        encode(p, cp, ssz);
                    495:                        } else {
1.114     schwarze  496:                                uc = mchars_spec2cp(seq, sz);
1.90      schwarze  497:                                if (uc > 0)
                    498:                                        encode1(p, uc);
1.89      schwarze  499:                        }
1.93      schwarze  500:                        continue;
1.83      schwarze  501:                case ESCAPE_FONTBOLD:
1.20      schwarze  502:                        term_fontrepl(p, TERMFONT_BOLD);
1.93      schwarze  503:                        continue;
1.83      schwarze  504:                case ESCAPE_FONTITALIC:
1.20      schwarze  505:                        term_fontrepl(p, TERMFONT_UNDER);
1.93      schwarze  506:                        continue;
1.83      schwarze  507:                case ESCAPE_FONTBI:
1.70      schwarze  508:                        term_fontrepl(p, TERMFONT_BI);
1.93      schwarze  509:                        continue;
1.83      schwarze  510:                case ESCAPE_FONT:
                    511:                case ESCAPE_FONTROMAN:
1.20      schwarze  512:                        term_fontrepl(p, TERMFONT_NONE);
1.93      schwarze  513:                        continue;
1.83      schwarze  514:                case ESCAPE_FONTPREV:
1.20      schwarze  515:                        term_fontlast(p);
1.130     schwarze  516:                        continue;
                    517:                case ESCAPE_BREAK:
                    518:                        bufferc(p, '\n');
1.93      schwarze  519:                        continue;
1.83      schwarze  520:                case ESCAPE_NOSPACE:
1.108     schwarze  521:                        if (p->flags & TERMP_BACKAFTER)
                    522:                                p->flags &= ~TERMP_BACKAFTER;
                    523:                        else if (*word == '\0')
1.97      schwarze  524:                                p->flags |= (TERMP_NOSPACE | TERMP_NONEWLINE);
1.121     schwarze  525:                        continue;
1.135   ! schwarze  526:                case ESCAPE_DEVICE:
        !           527:                        if (p->type == TERMTYPE_PDF)
        !           528:                                encode(p, "pdf", 3);
        !           529:                        else if (p->type == TERMTYPE_PS)
        !           530:                                encode(p, "ps", 2);
        !           531:                        else if (p->enc == TERMENC_ASCII)
        !           532:                                encode(p, "ascii", 5);
        !           533:                        else
        !           534:                                encode(p, "utf8", 4);
        !           535:                        continue;
1.121     schwarze  536:                case ESCAPE_HORIZ:
1.133     schwarze  537:                        if (*seq == '|') {
                    538:                                seq++;
                    539:                                uc = -p->col;
                    540:                        } else
                    541:                                uc = 0;
1.128     schwarze  542:                        if (a2roffsu(seq, &su, SCALE_EM) == NULL)
1.121     schwarze  543:                                continue;
1.133     schwarze  544:                        uc += term_hen(p, &su);
1.121     schwarze  545:                        if (uc > 0)
                    546:                                while (uc-- > 0)
                    547:                                        bufferc(p, ASCII_NBRSP);
                    548:                        else if (p->col > (size_t)(-uc))
                    549:                                p->col += uc;
                    550:                        else {
                    551:                                uc += p->col;
                    552:                                p->col = 0;
1.126     schwarze  553:                                if (p->tcol->offset > (size_t)(-uc)) {
1.121     schwarze  554:                                        p->ti += uc;
1.126     schwarze  555:                                        p->tcol->offset += uc;
1.121     schwarze  556:                                } else {
1.126     schwarze  557:                                        p->ti -= p->tcol->offset;
                    558:                                        p->tcol->offset = 0;
1.121     schwarze  559:                                }
1.122     schwarze  560:                        }
                    561:                        continue;
                    562:                case ESCAPE_HLINE:
1.132     schwarze  563:                        if ((cp = a2roffsu(seq, &su, SCALE_EM)) == NULL)
1.122     schwarze  564:                                continue;
1.131     schwarze  565:                        uc = term_hen(p, &su);
1.122     schwarze  566:                        if (uc <= 0) {
1.126     schwarze  567:                                if (p->tcol->rmargin <= p->tcol->offset)
1.122     schwarze  568:                                        continue;
1.126     schwarze  569:                                lsz = p->tcol->rmargin - p->tcol->offset;
1.122     schwarze  570:                        } else
                    571:                                lsz = uc;
1.132     schwarze  572:                        if (*cp == seq[-1])
1.122     schwarze  573:                                uc = -1;
1.132     schwarze  574:                        else if (*cp == '\\') {
                    575:                                seq = cp + 1;
1.122     schwarze  576:                                esc = mandoc_escape(&seq, &cp, &sz);
                    577:                                switch (esc) {
                    578:                                case ESCAPE_UNICODE:
                    579:                                        uc = mchars_num2uc(cp + 1, sz - 1);
                    580:                                        break;
                    581:                                case ESCAPE_NUMBERED:
                    582:                                        uc = mchars_num2char(cp, sz);
                    583:                                        break;
                    584:                                case ESCAPE_SPECIAL:
                    585:                                        uc = mchars_spec2cp(cp, sz);
                    586:                                        break;
                    587:                                default:
                    588:                                        uc = -1;
                    589:                                        break;
                    590:                                }
                    591:                        } else
1.132     schwarze  592:                                uc = *cp;
1.122     schwarze  593:                        if (uc < 0x20 || (uc > 0x7E && uc < 0xA0))
                    594:                                uc = '_';
                    595:                        if (p->enc == TERMENC_ASCII) {
                    596:                                cp = ascii_uc2str(uc);
                    597:                                csz = term_strlen(p, cp);
                    598:                                ssz = strlen(cp);
                    599:                        } else
                    600:                                csz = (*p->width)(p, uc);
                    601:                        while (lsz >= csz) {
                    602:                                if (p->enc == TERMENC_ASCII)
                    603:                                        encode(p, cp, ssz);
                    604:                                else
                    605:                                        encode1(p, uc);
                    606:                                lsz -= csz;
1.121     schwarze  607:                        }
1.93      schwarze  608:                        continue;
1.83      schwarze  609:                case ESCAPE_SKIPCHAR:
1.108     schwarze  610:                        p->flags |= TERMP_BACKAFTER;
1.93      schwarze  611:                        continue;
1.103     schwarze  612:                case ESCAPE_OVERSTRIKE:
                    613:                        cp = seq + sz;
                    614:                        while (seq < cp) {
                    615:                                if (*seq == '\\') {
                    616:                                        mandoc_escape(&seq, NULL, NULL);
                    617:                                        continue;
                    618:                                }
                    619:                                encode1(p, *seq++);
1.108     schwarze  620:                                if (seq < cp) {
                    621:                                        if (p->flags & TERMP_BACKBEFORE)
                    622:                                                p->flags |= TERMP_BACKAFTER;
                    623:                                        else
                    624:                                                p->flags |= TERMP_BACKBEFORE;
                    625:                                }
1.103     schwarze  626:                        }
1.109     schwarze  627:                        /* Trim trailing backspace/blank pair. */
1.129     schwarze  628:                        if (p->tcol->lastcol > 2 &&
                    629:                            (p->tcol->buf[p->tcol->lastcol - 1] == ' ' ||
                    630:                             p->tcol->buf[p->tcol->lastcol - 1] == '\t'))
                    631:                                p->tcol->lastcol -= 2;
                    632:                        if (p->col > p->tcol->lastcol)
                    633:                                p->col = p->tcol->lastcol;
1.108     schwarze  634:                        continue;
1.20      schwarze  635:                default:
1.93      schwarze  636:                        continue;
                    637:                }
                    638:
                    639:                /*
                    640:                 * Common handling for Unicode and numbered
                    641:                 * character escape sequences.
                    642:                 */
                    643:
                    644:                if (p->enc == TERMENC_ASCII) {
                    645:                        cp = ascii_uc2str(uc);
                    646:                        encode(p, cp, strlen(cp));
                    647:                } else {
                    648:                        if ((uc < 0x20 && uc != 0x09) ||
                    649:                            (uc > 0x7E && uc < 0xA0))
                    650:                                uc = 0xFFFD;
                    651:                        encode1(p, uc);
1.20      schwarze  652:                }
                    653:        }
1.75      schwarze  654:        p->flags &= ~TERMP_NBRWORD;
1.1       kristaps  655: }
                    656:
                    657: static void
1.126     schwarze  658: adjbuf(struct termp_col *c, size_t sz)
1.1       kristaps  659: {
1.126     schwarze  660:        if (c->maxcols == 0)
                    661:                c->maxcols = 1024;
                    662:        while (c->maxcols <= sz)
                    663:                c->maxcols <<= 2;
                    664:        c->buf = mandoc_reallocarray(c->buf, c->maxcols, sizeof(*c->buf));
1.1       kristaps  665: }
                    666:
1.4       schwarze  667: static void
1.20      schwarze  668: bufferc(struct termp *p, char c)
                    669: {
1.124     schwarze  670:        if (p->flags & TERMP_NOBUF) {
                    671:                (*p->letter)(p, c);
                    672:                return;
                    673:        }
1.126     schwarze  674:        if (p->col + 1 >= p->tcol->maxcols)
                    675:                adjbuf(p->tcol, p->col + 1);
1.129     schwarze  676:        if (p->tcol->lastcol <= p->col || (c != ' ' && c != ASCII_NBRSP))
1.126     schwarze  677:                p->tcol->buf[p->col] = c;
1.129     schwarze  678:        if (p->tcol->lastcol < ++p->col)
                    679:                p->tcol->lastcol = p->col;
1.20      schwarze  680: }
                    681:
1.59      schwarze  682: /*
                    683:  * See encode().
                    684:  * Do this for a single (probably unicode) value.
                    685:  * Does not check for non-decorated glyphs.
                    686:  */
                    687: static void
                    688: encode1(struct termp *p, int c)
                    689: {
                    690:        enum termfont     f;
                    691:
1.124     schwarze  692:        if (p->flags & TERMP_NOBUF) {
                    693:                (*p->letter)(p, c);
                    694:                return;
                    695:        }
                    696:
1.126     schwarze  697:        if (p->col + 7 >= p->tcol->maxcols)
                    698:                adjbuf(p->tcol, p->col + 7);
1.59      schwarze  699:
1.115     schwarze  700:        f = (c == ASCII_HYPH || c > 127 || isgraph(c)) ?
1.108     schwarze  701:            p->fontq[p->fonti] : TERMFONT_NONE;
1.59      schwarze  702:
1.108     schwarze  703:        if (p->flags & TERMP_BACKBEFORE) {
1.126     schwarze  704:                if (p->tcol->buf[p->col - 1] == ' ' ||
                    705:                    p->tcol->buf[p->col - 1] == '\t')
1.109     schwarze  706:                        p->col--;
                    707:                else
1.126     schwarze  708:                        p->tcol->buf[p->col++] = '\b';
1.108     schwarze  709:                p->flags &= ~TERMP_BACKBEFORE;
                    710:        }
1.126     schwarze  711:        if (f == TERMFONT_UNDER || f == TERMFONT_BI) {
                    712:                p->tcol->buf[p->col++] = '_';
                    713:                p->tcol->buf[p->col++] = '\b';
                    714:        }
                    715:        if (f == TERMFONT_BOLD || f == TERMFONT_BI) {
                    716:                if (c == ASCII_HYPH)
                    717:                        p->tcol->buf[p->col++] = '-';
1.70      schwarze  718:                else
1.126     schwarze  719:                        p->tcol->buf[p->col++] = c;
                    720:                p->tcol->buf[p->col++] = '\b';
1.70      schwarze  721:        }
1.129     schwarze  722:        if (p->tcol->lastcol <= p->col || (c != ' ' && c != ASCII_NBRSP))
1.126     schwarze  723:                p->tcol->buf[p->col] = c;
1.129     schwarze  724:        if (p->tcol->lastcol < ++p->col)
                    725:                p->tcol->lastcol = p->col;
1.108     schwarze  726:        if (p->flags & TERMP_BACKAFTER) {
                    727:                p->flags |= TERMP_BACKBEFORE;
                    728:                p->flags &= ~TERMP_BACKAFTER;
                    729:        }
1.59      schwarze  730: }
1.20      schwarze  731:
                    732: static void
                    733: encode(struct termp *p, const char *word, size_t sz)
1.4       schwarze  734: {
1.71      schwarze  735:        size_t            i;
1.124     schwarze  736:
                    737:        if (p->flags & TERMP_NOBUF) {
                    738:                for (i = 0; i < sz; i++)
                    739:                        (*p->letter)(p, word[i]);
                    740:                return;
                    741:        }
1.59      schwarze  742:
1.126     schwarze  743:        if (p->col + 2 + (sz * 5) >= p->tcol->maxcols)
                    744:                adjbuf(p->tcol, p->col + 2 + (sz * 5));
1.46      schwarze  745:
1.71      schwarze  746:        for (i = 0; i < sz; i++) {
1.70      schwarze  747:                if (ASCII_HYPH == word[i] ||
                    748:                    isgraph((unsigned char)word[i]))
                    749:                        encode1(p, word[i]);
1.119     schwarze  750:                else {
1.129     schwarze  751:                        if (p->tcol->lastcol <= p->col ||
1.125     schwarze  752:                            (word[i] != ' ' && word[i] != ASCII_NBRSP))
1.126     schwarze  753:                                p->tcol->buf[p->col] = word[i];
1.125     schwarze  754:                        p->col++;
1.119     schwarze  755:
                    756:                        /*
                    757:                         * Postpone the effect of \z while handling
                    758:                         * an overstrike sequence from ascii_uc2str().
                    759:                         */
                    760:
                    761:                        if (word[i] == '\b' &&
                    762:                            (p->flags & TERMP_BACKBEFORE)) {
                    763:                                p->flags &= ~TERMP_BACKBEFORE;
                    764:                                p->flags |= TERMP_BACKAFTER;
                    765:                        }
                    766:                }
1.4       schwarze  767:        }
1.129     schwarze  768:        if (p->tcol->lastcol < p->col)
                    769:                p->tcol->lastcol = p->col;
1.80      schwarze  770: }
                    771:
                    772: void
                    773: term_setwidth(struct termp *p, const char *wstr)
                    774: {
                    775:        struct roffsu    su;
1.107     schwarze  776:        int              iop, width;
1.80      schwarze  777:
1.81      schwarze  778:        iop = 0;
                    779:        width = 0;
1.80      schwarze  780:        if (NULL != wstr) {
                    781:                switch (*wstr) {
1.83      schwarze  782:                case '+':
1.80      schwarze  783:                        iop = 1;
                    784:                        wstr++;
                    785:                        break;
1.83      schwarze  786:                case '-':
1.80      schwarze  787:                        iop = -1;
                    788:                        wstr++;
                    789:                        break;
                    790:                default:
                    791:                        break;
                    792:                }
1.128     schwarze  793:                if (a2roffsu(wstr, &su, SCALE_MAX) != NULL)
1.81      schwarze  794:                        width = term_hspan(p, &su);
                    795:                else
1.80      schwarze  796:                        iop = 0;
                    797:        }
                    798:        (*p->setwidth)(p, iop, width);
1.4       schwarze  799: }
1.16      schwarze  800:
                    801: size_t
1.39      schwarze  802: term_len(const struct termp *p, size_t sz)
                    803: {
                    804:
1.112     schwarze  805:        return (*p->width)(p, ' ') * sz;
1.39      schwarze  806: }
                    807:
1.64      schwarze  808: static size_t
                    809: cond_width(const struct termp *p, int c, int *skip)
                    810: {
                    811:
                    812:        if (*skip) {
                    813:                (*skip) = 0;
1.112     schwarze  814:                return 0;
1.64      schwarze  815:        } else
1.112     schwarze  816:                return (*p->width)(p, c);
1.64      schwarze  817: }
1.39      schwarze  818:
                    819: size_t
                    820: term_strlen(const struct termp *p, const char *cp)
                    821: {
1.59      schwarze  822:        size_t           sz, rsz, i;
1.93      schwarze  823:        int              ssz, skip, uc;
1.50      schwarze  824:        const char      *seq, *rhs;
1.59      schwarze  825:        enum mandoc_esc  esc;
1.77      schwarze  826:        static const char rej[] = { '\\', ASCII_NBRSP, ASCII_HYPH,
                    827:                        ASCII_BREAK, '\0' };
1.59      schwarze  828:
                    829:        /*
                    830:         * Account for escaped sequences within string length
                    831:         * calculations.  This follows the logic in term_word() as we
                    832:         * must calculate the width of produced strings.
                    833:         */
                    834:
                    835:        sz = 0;
1.64      schwarze  836:        skip = 0;
1.59      schwarze  837:        while ('\0' != *cp) {
                    838:                rsz = strcspn(cp, rej);
                    839:                for (i = 0; i < rsz; i++)
1.64      schwarze  840:                        sz += cond_width(p, *cp++, &skip);
1.59      schwarze  841:
                    842:                switch (*cp) {
1.83      schwarze  843:                case '\\':
1.59      schwarze  844:                        cp++;
                    845:                        esc = mandoc_escape(&cp, &seq, &ssz);
                    846:                        if (ESCAPE_ERROR == esc)
1.85      schwarze  847:                                continue;
1.59      schwarze  848:
                    849:                        rhs = NULL;
1.50      schwarze  850:
1.59      schwarze  851:                        switch (esc) {
1.83      schwarze  852:                        case ESCAPE_UNICODE:
1.94      schwarze  853:                                uc = mchars_num2uc(seq + 1, ssz - 1);
1.59      schwarze  854:                                break;
1.83      schwarze  855:                        case ESCAPE_NUMBERED:
1.93      schwarze  856:                                uc = mchars_num2char(seq, ssz);
                    857:                                if (uc < 0)
                    858:                                        continue;
1.50      schwarze  859:                                break;
1.83      schwarze  860:                        case ESCAPE_SPECIAL:
1.93      schwarze  861:                                if (p->enc == TERMENC_ASCII) {
1.114     schwarze  862:                                        rhs = mchars_spec2str(seq, ssz, &rsz);
1.93      schwarze  863:                                        if (rhs != NULL)
                    864:                                                break;
                    865:                                } else {
1.114     schwarze  866:                                        uc = mchars_spec2cp(seq, ssz);
1.93      schwarze  867:                                        if (uc > 0)
                    868:                                                sz += cond_width(p, uc, &skip);
1.89      schwarze  869:                                }
1.93      schwarze  870:                                continue;
1.135   ! schwarze  871:                        case ESCAPE_DEVICE:
        !           872:                                if (p->type == TERMTYPE_PDF) {
        !           873:                                        rhs = "pdf";
        !           874:                                        rsz = 3;
        !           875:                                } else if (p->type == TERMTYPE_PS) {
        !           876:                                        rhs = "ps";
        !           877:                                        rsz = 2;
        !           878:                                } else if (p->enc == TERMENC_ASCII) {
        !           879:                                        rhs = "ascii";
        !           880:                                        rsz = 5;
        !           881:                                } else {
        !           882:                                        rhs = "utf8";
        !           883:                                        rsz = 4;
        !           884:                                }
        !           885:                                break;
1.83      schwarze  886:                        case ESCAPE_SKIPCHAR:
1.64      schwarze  887:                                skip = 1;
1.103     schwarze  888:                                continue;
                    889:                        case ESCAPE_OVERSTRIKE:
                    890:                                rsz = 0;
                    891:                                rhs = seq + ssz;
                    892:                                while (seq < rhs) {
                    893:                                        if (*seq == '\\') {
                    894:                                                mandoc_escape(&seq, NULL, NULL);
                    895:                                                continue;
                    896:                                        }
                    897:                                        i = (*p->width)(p, *seq++);
                    898:                                        if (rsz < i)
                    899:                                                rsz = i;
                    900:                                }
                    901:                                sz += rsz;
1.93      schwarze  902:                                continue;
1.50      schwarze  903:                        default:
1.93      schwarze  904:                                continue;
1.50      schwarze  905:                        }
1.39      schwarze  906:
1.93      schwarze  907:                        /*
                    908:                         * Common handling for Unicode and numbered
                    909:                         * character escape sequences.
                    910:                         */
                    911:
                    912:                        if (rhs == NULL) {
                    913:                                if (p->enc == TERMENC_ASCII) {
                    914:                                        rhs = ascii_uc2str(uc);
                    915:                                        rsz = strlen(rhs);
                    916:                                } else {
                    917:                                        if ((uc < 0x20 && uc != 0x09) ||
                    918:                                            (uc > 0x7E && uc < 0xA0))
                    919:                                                uc = 0xFFFD;
                    920:                                        sz += cond_width(p, uc, &skip);
                    921:                                        continue;
                    922:                                }
                    923:                        }
1.59      schwarze  924:
1.64      schwarze  925:                        if (skip) {
                    926:                                skip = 0;
                    927:                                break;
                    928:                        }
1.93      schwarze  929:
                    930:                        /*
                    931:                         * Common handling for all escape sequences
                    932:                         * printing more than one character.
                    933:                         */
1.64      schwarze  934:
1.59      schwarze  935:                        for (i = 0; i < rsz; i++)
                    936:                                sz += (*p->width)(p, *rhs++);
                    937:                        break;
1.83      schwarze  938:                case ASCII_NBRSP:
1.64      schwarze  939:                        sz += cond_width(p, ' ', &skip);
1.55      schwarze  940:                        cp++;
1.59      schwarze  941:                        break;
1.83      schwarze  942:                case ASCII_HYPH:
1.64      schwarze  943:                        sz += cond_width(p, '-', &skip);
1.55      schwarze  944:                        cp++;
1.59      schwarze  945:                        break;
                    946:                default:
                    947:                        break;
                    948:                }
                    949:        }
1.39      schwarze  950:
1.112     schwarze  951:        return sz;
1.39      schwarze  952: }
                    953:
1.100     schwarze  954: int
1.39      schwarze  955: term_vspan(const struct termp *p, const struct roffsu *su)
1.16      schwarze  956: {
                    957:        double           r;
1.101     schwarze  958:        int              ri;
1.16      schwarze  959:
                    960:        switch (su->unit) {
1.99      schwarze  961:        case SCALE_BU:
                    962:                r = su->scale / 40.0;
                    963:                break;
1.83      schwarze  964:        case SCALE_CM:
1.99      schwarze  965:                r = su->scale * 6.0 / 2.54;
                    966:                break;
                    967:        case SCALE_FS:
                    968:                r = su->scale * 65536.0 / 40.0;
1.16      schwarze  969:                break;
1.83      schwarze  970:        case SCALE_IN:
1.86      schwarze  971:                r = su->scale * 6.0;
1.16      schwarze  972:                break;
1.99      schwarze  973:        case SCALE_MM:
                    974:                r = su->scale * 0.006;
                    975:                break;
1.83      schwarze  976:        case SCALE_PC:
1.16      schwarze  977:                r = su->scale;
                    978:                break;
1.83      schwarze  979:        case SCALE_PT:
1.99      schwarze  980:                r = su->scale / 12.0;
1.16      schwarze  981:                break;
1.99      schwarze  982:        case SCALE_EN:
                    983:        case SCALE_EM:
                    984:                r = su->scale * 0.6;
1.16      schwarze  985:                break;
1.83      schwarze  986:        case SCALE_VS:
1.16      schwarze  987:                r = su->scale;
                    988:                break;
                    989:        default:
1.99      schwarze  990:                abort();
1.16      schwarze  991:        }
1.101     schwarze  992:        ri = r > 0.0 ? r + 0.4995 : r - 0.4995;
1.112     schwarze  993:        return ri < 66 ? ri : 1;
1.16      schwarze  994: }
                    995:
1.107     schwarze  996: /*
1.131     schwarze  997:  * Convert a scaling width to basic units, rounding towards 0.
1.107     schwarze  998:  */
1.100     schwarze  999: int
1.39      schwarze 1000: term_hspan(const struct termp *p, const struct roffsu *su)
1.16      schwarze 1001: {
                   1002:
1.112     schwarze 1003:        return (*p->hspan)(p, su);
1.131     schwarze 1004: }
                   1005:
                   1006: /*
                   1007:  * Convert a scaling width to basic units, rounding to closest.
                   1008:  */
                   1009: int
                   1010: term_hen(const struct termp *p, const struct roffsu *su)
                   1011: {
                   1012:        int bu;
                   1013:
                   1014:        if ((bu = (*p->hspan)(p, su)) >= 0)
                   1015:                return (bu + 11) / 24;
                   1016:        else
                   1017:                return -((-bu + 11) / 24);
1.16      schwarze 1018: }