src/usr.bin/mandoc/term.c - annotate

Return to term.c CVS log
Up to [local] / src / usr.bin / mandoc
Annotation of src/usr.bin/mandoc/term.c, Revision 1.122

1.122   ! schwarze    1: /*     $OpenBSD: term.c,v 1.121 2017/06/01 19:05:15 schwarze Exp $ */
1.1       kristaps    2: /*
1.59      schwarze    3:  * Copyright (c) 2008, 2009, 2010, 2011 Kristaps Dzonsons <kristaps@bsd.lv>
1.119     schwarze    4:  * Copyright (c) 2010-2017 Ingo Schwarze <schwarze@openbsd.org>
1.1       kristaps    5:  *
                      6:  * Permission to use, copy, modify, and distribute this software for any
1.2       schwarze    7:  * purpose with or without fee is hereby granted, provided that the above
                      8:  * copyright notice and this permission notice appear in all copies.
1.1       kristaps    9:  *
1.106     schwarze   10:  * THE SOFTWARE IS PROVIDED "AS IS" AND THE AUTHORS DISCLAIM ALL WARRANTIES
1.2       schwarze   11:  * WITH REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED WARRANTIES OF
1.106     schwarze   12:  * MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL THE AUTHORS BE LIABLE FOR
1.2       schwarze   13:  * ANY SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL DAMAGES OR ANY DAMAGES
                     14:  * WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN
                     15:  * ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF
                     16:  * OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.
1.1       kristaps   17:  */
1.20      schwarze   18: #include <sys/types.h>
                     19:
1.1       kristaps   20: #include <assert.h>
1.20      schwarze   21: #include <ctype.h>
1.1       kristaps   22: #include <stdio.h>
                     23: #include <stdlib.h>
                     24: #include <string.h>
                     25:
1.34      schwarze   26: #include "mandoc.h"
1.79      schwarze   27: #include "mandoc_aux.h"
1.16      schwarze   28: #include "out.h"
1.1       kristaps   29: #include "term.h"
1.16      schwarze   30: #include "main.h"
1.1       kristaps   31:
1.64      schwarze   32: static size_t           cond_width(const struct termp *, int, int *);
1.71      schwarze   33: static void             adjbuf(struct termp *p, size_t);
1.59      schwarze   34: static void             bufferc(struct termp *, char);
                     35: static void             encode(struct termp *, const char *, size_t);
                     36: static void             encode1(struct termp *, int);
1.1       kristaps   37:
1.83      schwarze   38:
1.37      schwarze   39: void
                     40: term_free(struct termp *p)
1.1       kristaps   41: {
                     42:
1.91      schwarze   43:        free(p->buf);
1.98      schwarze   44:        free(p->fontq);
1.37      schwarze   45:        free(p);
1.1       kristaps   46: }
                     47:
1.13      schwarze   48: void
1.83      schwarze   49: term_begin(struct termp *p, term_margin head,
1.106     schwarze   50:                term_margin foot, const struct roff_meta *arg)
1.1       kristaps   51: {
                     52:
1.37      schwarze   53:        p->headf = head;
                     54:        p->footf = foot;
                     55:        p->argf = arg;
                     56:        (*p->begin)(p);
1.1       kristaps   57: }
                     58:
1.37      schwarze   59: void
                     60: term_end(struct termp *p)
1.1       kristaps   61: {
                     62:
1.37      schwarze   63:        (*p->end)(p);
1.1       kristaps   64: }
                     65:
                     66: /*
1.82      schwarze   67:  * Flush a chunk of text.  By default, break the output line each time
                     68:  * the right margin is reached, and continue output on the next line
                     69:  * at the same offset as the chunk itself.  By default, also break the
                     70:  * output line at the end of the chunk.
1.27      schwarze   71:  * The following flags may be specified:
1.1       kristaps   72:  *
1.82      schwarze   73:  *  - TERMP_NOBREAK: Do not break the output line at the right margin,
                     74:  *    but only at the max right margin.  Also, do not break the output
                     75:  *    line at the end of the chunk, such that the next call can pad to
                     76:  *    the next column.  However, if less than p->trailspace blanks,
                     77:  *    which can be 0, 1, or 2, remain to the right margin, the line
                     78:  *    will be broken.
1.110     schwarze   79:  *  - TERMP_BRTRSP: Consider trailing whitespace significant
                     80:  *    when deciding whether the chunk fits or not.
1.82      schwarze   81:  *  - TERMP_BRIND: If the chunk does not fit and the output line has
                     82:  *    to be broken, start the next line at the right margin instead
                     83:  *    of at the offset.  Used together with TERMP_NOBREAK for the tags
                     84:  *    in various kinds of tagged lists.
                     85:  *  - TERMP_DANGLE: Do not break the output line at the right margin,
                     86:  *    append the next chunk after it even if this one is too long.
                     87:  *    To be used together with TERMP_NOBREAK.
                     88:  *  - TERMP_HANG: Like TERMP_DANGLE, and also suppress padding before
                     89:  *    the next chunk if this column is not full.
1.1       kristaps   90:  */
                     91: void
                     92: term_flushln(struct termp *p)
                     93: {
1.71      schwarze   94:        size_t           i;     /* current input position in p->buf */
1.66      schwarze   95:        int              ntab;  /* number of tabs to prepend */
1.19      schwarze   96:        size_t           vis;   /* current visual position on output */
                     97:        size_t           vbl;   /* number of blanks to prepend to output */
1.33      schwarze   98:        size_t           vend;  /* end of word visual position on output */
1.19      schwarze   99:        size_t           bp;    /* visual right border position */
1.51      schwarze  100:        size_t           dv;    /* temporary for visual pos calculations */
1.71      schwarze  101:        size_t           j;     /* temporary loop index for p->buf */
                    102:        size_t           jhy;   /* last hyph before overflow w/r/t j */
1.42      schwarze  103:        size_t           maxvis; /* output position of visible boundary */
1.1       kristaps  104:
                    105:        /*
                    106:         * First, establish the maximum columns of "visible" content.
                    107:         * This is usually the difference between the right-margin and
                    108:         * an indentation, but can be, for tagged lists or columns, a
1.73      schwarze  109:         * small set of values.
                    110:         *
                    111:         * The following unsigned-signed subtractions look strange,
                    112:         * but they are actually correct.  If the int p->overstep
                    113:         * is negative, it gets sign extended.  Subtracting that
                    114:         * very large size_t effectively adds a small number to dv.
1.1       kristaps  115:         */
1.100     schwarze  116:        dv = p->rmargin > p->offset ? p->rmargin - p->offset : 0;
1.53      schwarze  117:        maxvis = (int)dv > p->overstep ? dv - (size_t)p->overstep : 0;
1.9       schwarze  118:
1.96      schwarze  119:        if (p->flags & TERMP_NOBREAK) {
                    120:                dv = p->maxrmargin > p->offset ?
                    121:                     p->maxrmargin - p->offset : 0;
                    122:                bp = (int)dv > p->overstep ?
                    123:                     dv - (size_t)p->overstep : 0;
                    124:        } else
                    125:                bp = maxvis;
1.19      schwarze  126:
1.33      schwarze  127:        /*
1.61      schwarze  128:         * Calculate the required amount of padding.
1.33      schwarze  129:         */
1.61      schwarze  130:        vbl = p->offset + p->overstep > p->viscol ?
                    131:              p->offset + p->overstep - p->viscol : 0;
1.33      schwarze  132:
1.53      schwarze  133:        vis = vend = 0;
                    134:        i = 0;
1.19      schwarze  135:
1.59      schwarze  136:        while (i < p->col) {
1.22      schwarze  137:                /*
1.42      schwarze  138:                 * Handle literal tab characters: collapse all
                    139:                 * subsequent tabs into a single huge set of spaces.
1.30      schwarze  140:                 */
1.66      schwarze  141:                ntab = 0;
1.120     schwarze  142:                while (i < p->col && p->buf[i] == '\t') {
                    143:                        vend = term_tab_next(vis);
1.30      schwarze  144:                        vbl += vend - vis;
                    145:                        vis = vend;
1.66      schwarze  146:                        ntab++;
1.49      schwarze  147:                        i++;
1.30      schwarze  148:                }
1.22      schwarze  149:
1.1       kristaps  150:                /*
                    151:                 * Count up visible word characters.  Control sequences
                    152:                 * (starting with the CSI) aren't counted.  A space
                    153:                 * generates a non-printing word, which is valid (the
                    154:                 * space is printed according to regular spacing rules).
                    155:                 */
                    156:
1.59      schwarze  157:                for (j = i, jhy = 0; j < p->col; j++) {
1.69      schwarze  158:                        if (' ' == p->buf[j] || '\t' == p->buf[j])
1.1       kristaps  159:                                break;
1.42      schwarze  160:
1.117     krw       161:                        /* Back over the last printed character. */
1.42      schwarze  162:                        if (8 == p->buf[j]) {
                    163:                                assert(j);
                    164:                                vend -= (*p->width)(p, p->buf[j - 1]);
                    165:                                continue;
                    166:                        }
                    167:
                    168:                        /* Regular word. */
                    169:                        /* Break at the hyphen point if we overrun. */
1.83      schwarze  170:                        if (vend > vis && vend < bp &&
1.77      schwarze  171:                            (ASCII_HYPH == p->buf[j] ||
                    172:                             ASCII_BREAK == p->buf[j]))
1.42      schwarze  173:                                jhy = j;
                    174:
1.78      schwarze  175:                        /*
                    176:                         * Hyphenation now decided, put back a real
                    177:                         * hyphen such that we get the correct width.
                    178:                         */
                    179:                        if (ASCII_HYPH == p->buf[j])
                    180:                                p->buf[j] = '-';
                    181:
1.42      schwarze  182:                        vend += (*p->width)(p, p->buf[j]);
1.1       kristaps  183:                }
                    184:
                    185:                /*
1.5       schwarze  186:                 * Find out whether we would exceed the right margin.
1.33      schwarze  187:                 * If so, break to the next line.
1.5       schwarze  188:                 */
1.33      schwarze  189:                if (vend > bp && 0 == jhy && vis > 0) {
1.22      schwarze  190:                        vend -= vis;
1.37      schwarze  191:                        (*p->endline)(p);
1.62      schwarze  192:                        p->viscol = 0;
1.66      schwarze  193:
1.120     schwarze  194:                        /* Use pending tabs on the new line. */
                    195:
                    196:                        vbl = 0;
                    197:                        while (ntab--)
                    198:                                vbl = term_tab_next(vbl);
                    199:
                    200:                        /* Re-establish indentation. */
1.66      schwarze  201:
1.120     schwarze  202:                        if (p->flags & TERMP_BRIND) {
                    203:                                vbl += p->rmargin;
                    204:                                vend += p->rmargin - p->offset;
                    205:                        } else
                    206:                                vbl += p->offset;
1.33      schwarze  207:
1.73      schwarze  208:                        /*
                    209:                         * Remove the p->overstep width.
                    210:                         * Again, if p->overstep is negative,
                    211:                         * sign extension does the right thing.
                    212:                         */
1.33      schwarze  213:
1.53      schwarze  214:                        bp += (size_t)p->overstep;
1.26      schwarze  215:                        p->overstep = 0;
1.1       kristaps  216:                }
1.30      schwarze  217:
1.33      schwarze  218:                /* Write out the [remaining] word. */
1.59      schwarze  219:                for ( ; i < p->col; i++) {
1.25      schwarze  220:                        if (vend > bp && jhy > 0 && i > jhy)
1.30      schwarze  221:                                break;
                    222:                        if ('\t' == p->buf[i])
1.1       kristaps  223:                                break;
1.22      schwarze  224:                        if (' ' == p->buf[i]) {
1.46      schwarze  225:                                j = i;
1.88      schwarze  226:                                while (i < p->col && ' ' == p->buf[i])
1.33      schwarze  227:                                        i++;
1.71      schwarze  228:                                dv = (i - j) * (*p->width)(p, ' ');
1.51      schwarze  229:                                vbl += dv;
                    230:                                vend += dv;
1.22      schwarze  231:                                break;
                    232:                        }
1.33      schwarze  233:                        if (ASCII_NBRSP == p->buf[i]) {
1.42      schwarze  234:                                vbl += (*p->width)(p, ' ');
1.33      schwarze  235:                                continue;
                    236:                        }
1.77      schwarze  237:                        if (ASCII_BREAK == p->buf[i])
                    238:                                continue;
1.33      schwarze  239:
                    240:                        /*
                    241:                         * Now we definitely know there will be
                    242:                         * printable characters to output,
                    243:                         * so write preceding white space now.
                    244:                         */
                    245:                        if (vbl) {
1.37      schwarze  246:                                (*p->advance)(p, vbl);
1.33      schwarze  247:                                p->viscol += vbl;
                    248:                                vbl = 0;
1.61      schwarze  249:                        }
                    250:
                    251:                        (*p->letter)(p, p->buf[i]);
                    252:                        if (8 == p->buf[i])
                    253:                                p->viscol -= (*p->width)(p, p->buf[i-1]);
1.83      schwarze  254:                        else
1.42      schwarze  255:                                p->viscol += (*p->width)(p, p->buf[i]);
1.1       kristaps  256:                }
1.22      schwarze  257:                vis = vend;
1.1       kristaps  258:        }
1.48      schwarze  259:
                    260:        /*
                    261:         * If there was trailing white space, it was not printed;
                    262:         * so reset the cursor position accordingly.
                    263:         */
1.95      schwarze  264:        if (vis > vbl)
1.61      schwarze  265:                vis -= vbl;
1.95      schwarze  266:        else
                    267:                vis = 0;
1.18      schwarze  268:
1.9       schwarze  269:        p->col = 0;
1.26      schwarze  270:        p->overstep = 0;
1.108     schwarze  271:        p->flags &= ~(TERMP_BACKAFTER | TERMP_BACKBEFORE);
1.1       kristaps  272:
1.9       schwarze  273:        if ( ! (TERMP_NOBREAK & p->flags)) {
1.29      schwarze  274:                p->viscol = 0;
1.37      schwarze  275:                (*p->endline)(p);
1.1       kristaps  276:                return;
                    277:        }
                    278:
1.9       schwarze  279:        if (TERMP_HANG & p->flags) {
1.102     schwarze  280:                p->overstep += (int)(p->offset + vis - p->rmargin +
1.83      schwarze  281:                    p->trailspace * (*p->width)(p, ' '));
1.9       schwarze  282:
                    283:                /*
                    284:                 * If we have overstepped the margin, temporarily move
                    285:                 * it to the right and flag the rest of the line to be
                    286:                 * shorter.
1.73      schwarze  287:                 * If there is a request to keep the columns together,
                    288:                 * allow negative overstep when the column is not full.
1.9       schwarze  289:                 */
1.73      schwarze  290:                if (p->trailspace && p->overstep < 0)
1.26      schwarze  291:                        p->overstep = 0;
1.61      schwarze  292:                return;
1.9       schwarze  293:
                    294:        } else if (TERMP_DANGLE & p->flags)
                    295:                return;
1.110     schwarze  296:
                    297:        /* Trailing whitespace is significant in some columns. */
                    298:        if (vis && vbl && (TERMP_BRTRSP & p->flags))
                    299:                vis += vbl;
1.1       kristaps  300:
1.61      schwarze  301:        /* If the column was overrun, break the line. */
1.72      schwarze  302:        if (maxvis < vis + p->trailspace * (*p->width)(p, ' ')) {
1.37      schwarze  303:                (*p->endline)(p);
1.61      schwarze  304:                p->viscol = 0;
1.9       schwarze  305:        }
1.1       kristaps  306: }
                    307:
1.83      schwarze  308: /*
1.1       kristaps  309:  * A newline only breaks an existing line; it won't assert vertical
                    310:  * space.  All data in the output buffer is flushed prior to the newline
                    311:  * assertion.
                    312:  */
                    313: void
                    314: term_newln(struct termp *p)
                    315: {
                    316:
                    317:        p->flags |= TERMP_NOSPACE;
1.61      schwarze  318:        if (p->col || p->viscol)
                    319:                term_flushln(p);
1.1       kristaps  320: }
                    321:
                    322: /*
                    323:  * Asserts a vertical space (a full, empty line-break between lines).
                    324:  * Note that if used twice, this will cause two blank spaces and so on.
                    325:  * All data in the output buffer is flushed prior to the newline
                    326:  * assertion.
                    327:  */
                    328: void
                    329: term_vspace(struct termp *p)
                    330: {
                    331:
                    332:        term_newln(p);
1.29      schwarze  333:        p->viscol = 0;
1.63      schwarze  334:        if (0 < p->skipvsp)
                    335:                p->skipvsp--;
                    336:        else
                    337:                (*p->endline)(p);
1.1       kristaps  338: }
                    339:
1.98      schwarze  340: /* Swap current and previous font; for \fP and .ft P */
1.20      schwarze  341: void
                    342: term_fontlast(struct termp *p)
                    343: {
                    344:        enum termfont    f;
1.11      schwarze  345:
1.20      schwarze  346:        f = p->fontl;
                    347:        p->fontl = p->fontq[p->fonti];
                    348:        p->fontq[p->fonti] = f;
                    349: }
                    350:
1.98      schwarze  351: /* Set font, save current, discard previous; for \f, .ft, .B etc. */
1.20      schwarze  352: void
                    353: term_fontrepl(struct termp *p, enum termfont f)
                    354: {
                    355:
                    356:        p->fontl = p->fontq[p->fonti];
                    357:        p->fontq[p->fonti] = f;
1.1       kristaps  358: }
                    359:
1.98      schwarze  360: /* Set font, save previous. */
1.20      schwarze  361: void
                    362: term_fontpush(struct termp *p, enum termfont f)
1.1       kristaps  363: {
1.7       schwarze  364:
1.20      schwarze  365:        p->fontl = p->fontq[p->fonti];
1.98      schwarze  366:        if (++p->fonti == p->fontsz) {
                    367:                p->fontsz += 8;
                    368:                p->fontq = mandoc_reallocarray(p->fontq,
1.116     schwarze  369:                    p->fontsz, sizeof(*p->fontq));
1.98      schwarze  370:        }
                    371:        p->fontq[p->fonti] = f;
1.20      schwarze  372: }
1.1       kristaps  373:
1.98      schwarze  374: /* Flush to make the saved pointer current again. */
1.20      schwarze  375: void
1.104     schwarze  376: term_fontpopq(struct termp *p, int i)
1.20      schwarze  377: {
1.1       kristaps  378:
1.104     schwarze  379:        assert(i >= 0);
                    380:        if (p->fonti > i)
                    381:                p->fonti = i;
1.20      schwarze  382: }
1.1       kristaps  383:
1.98      schwarze  384: /* Pop one font off the stack. */
1.20      schwarze  385: void
                    386: term_fontpop(struct termp *p)
                    387: {
1.1       kristaps  388:
1.20      schwarze  389:        assert(p->fonti);
                    390:        p->fonti--;
1.1       kristaps  391: }
                    392:
                    393: /*
                    394:  * Handle pwords, partial words, which may be either a single word or a
                    395:  * phrase that cannot be broken down (such as a literal string).  This
                    396:  * handles word styling.
                    397:  */
1.7       schwarze  398: void
                    399: term_word(struct termp *p, const char *word)
1.1       kristaps  400: {
1.121     schwarze  401:        struct roffsu    su;
1.75      schwarze  402:        const char       nbrsp[2] = { ASCII_NBRSP, 0 };
1.59      schwarze  403:        const char      *seq, *cp;
                    404:        int              sz, uc;
1.122   ! schwarze  405:        size_t           csz, lsz, ssz;
1.59      schwarze  406:        enum mandoc_esc  esc;
1.1       kristaps  407:
1.31      schwarze  408:        if ( ! (TERMP_NOSPACE & p->flags)) {
1.40      schwarze  409:                if ( ! (TERMP_KEEP & p->flags)) {
1.31      schwarze  410:                        bufferc(p, ' ');
1.40      schwarze  411:                        if (TERMP_SENTENCE & p->flags)
                    412:                                bufferc(p, ' ');
                    413:                } else
                    414:                        bufferc(p, ASCII_NBRSP);
1.31      schwarze  415:        }
1.68      schwarze  416:        if (TERMP_PREKEEP & p->flags)
                    417:                p->flags |= TERMP_KEEP;
1.1       kristaps  418:
                    419:        if ( ! (p->flags & TERMP_NONOSPACE))
                    420:                p->flags &= ~TERMP_NOSPACE;
1.46      schwarze  421:        else
                    422:                p->flags |= TERMP_NOSPACE;
1.1       kristaps  423:
1.97      schwarze  424:        p->flags &= ~(TERMP_SENTENCE | TERMP_NONEWLINE);
1.105     schwarze  425:        p->skipvsp = 0;
1.31      schwarze  426:
1.59      schwarze  427:        while ('\0' != *word) {
1.64      schwarze  428:                if ('\\' != *word) {
1.75      schwarze  429:                        if (TERMP_NBRWORD & p->flags) {
                    430:                                if (' ' == *word) {
                    431:                                        encode(p, nbrsp, 1);
                    432:                                        word++;
                    433:                                        continue;
                    434:                                }
                    435:                                ssz = strcspn(word, "\\ ");
                    436:                        } else
                    437:                                ssz = strcspn(word, "\\");
1.45      schwarze  438:                        encode(p, word, ssz);
1.64      schwarze  439:                        word += (int)ssz;
1.20      schwarze  440:                        continue;
1.64      schwarze  441:                }
1.20      schwarze  442:
1.59      schwarze  443:                word++;
                    444:                esc = mandoc_escape(&word, &seq, &sz);
                    445:                if (ESCAPE_ERROR == esc)
1.85      schwarze  446:                        continue;
1.59      schwarze  447:
                    448:                switch (esc) {
1.83      schwarze  449:                case ESCAPE_UNICODE:
1.89      schwarze  450:                        uc = mchars_num2uc(seq + 1, sz - 1);
1.56      schwarze  451:                        break;
1.83      schwarze  452:                case ESCAPE_NUMBERED:
1.93      schwarze  453:                        uc = mchars_num2char(seq, sz);
                    454:                        if (uc < 0)
                    455:                                continue;
1.20      schwarze  456:                        break;
1.83      schwarze  457:                case ESCAPE_SPECIAL:
1.89      schwarze  458:                        if (p->enc == TERMENC_ASCII) {
1.114     schwarze  459:                                cp = mchars_spec2str(seq, sz, &ssz);
1.92      schwarze  460:                                if (cp != NULL)
1.89      schwarze  461:                                        encode(p, cp, ssz);
                    462:                        } else {
1.114     schwarze  463:                                uc = mchars_spec2cp(seq, sz);
1.90      schwarze  464:                                if (uc > 0)
                    465:                                        encode1(p, uc);
1.89      schwarze  466:                        }
1.93      schwarze  467:                        continue;
1.83      schwarze  468:                case ESCAPE_FONTBOLD:
1.20      schwarze  469:                        term_fontrepl(p, TERMFONT_BOLD);
1.93      schwarze  470:                        continue;
1.83      schwarze  471:                case ESCAPE_FONTITALIC:
1.20      schwarze  472:                        term_fontrepl(p, TERMFONT_UNDER);
1.93      schwarze  473:                        continue;
1.83      schwarze  474:                case ESCAPE_FONTBI:
1.70      schwarze  475:                        term_fontrepl(p, TERMFONT_BI);
1.93      schwarze  476:                        continue;
1.83      schwarze  477:                case ESCAPE_FONT:
                    478:                case ESCAPE_FONTROMAN:
1.20      schwarze  479:                        term_fontrepl(p, TERMFONT_NONE);
1.93      schwarze  480:                        continue;
1.83      schwarze  481:                case ESCAPE_FONTPREV:
1.20      schwarze  482:                        term_fontlast(p);
1.93      schwarze  483:                        continue;
1.83      schwarze  484:                case ESCAPE_NOSPACE:
1.108     schwarze  485:                        if (p->flags & TERMP_BACKAFTER)
                    486:                                p->flags &= ~TERMP_BACKAFTER;
                    487:                        else if (*word == '\0')
1.97      schwarze  488:                                p->flags |= (TERMP_NOSPACE | TERMP_NONEWLINE);
1.121     schwarze  489:                        continue;
                    490:                case ESCAPE_HORIZ:
                    491:                        if (a2roffsu(seq, &su, SCALE_EM) == 0)
                    492:                                continue;
                    493:                        uc = term_hspan(p, &su) / 24;
                    494:                        if (uc > 0)
                    495:                                while (uc-- > 0)
                    496:                                        bufferc(p, ASCII_NBRSP);
                    497:                        else if (p->col > (size_t)(-uc))
                    498:                                p->col += uc;
                    499:                        else {
                    500:                                uc += p->col;
                    501:                                p->col = 0;
                    502:                                if (p->offset > (size_t)(-uc)) {
                    503:                                        p->ti += uc;
                    504:                                        p->offset += uc;
                    505:                                } else {
                    506:                                        p->ti -= p->offset;
                    507:                                        p->offset = 0;
                    508:                                }
1.122   ! schwarze  509:                        }
        !           510:                        continue;
        !           511:                case ESCAPE_HLINE:
        !           512:                        if (a2roffsu(seq, &su, SCALE_EM) == 0)
        !           513:                                continue;
        !           514:                        uc = term_hspan(p, &su) / 24;
        !           515:                        if (uc <= 0) {
        !           516:                                if (p->rmargin <= p->offset)
        !           517:                                        continue;
        !           518:                                lsz = p->rmargin - p->offset;
        !           519:                        } else
        !           520:                                lsz = uc;
        !           521:                        while (sz &&
        !           522:                            strchr(" %&()*+-./0123456789:<=>", *seq)) {
        !           523:                                seq++;
        !           524:                                sz--;
        !           525:                        }
        !           526:                        if (sz && strchr("cifMmnPpuv", *seq)) {
        !           527:                                seq++;
        !           528:                                sz--;
        !           529:                        }
        !           530:                        if (sz == 0)
        !           531:                                uc = -1;
        !           532:                        else if (*seq == '\\') {
        !           533:                                seq++;
        !           534:                                esc = mandoc_escape(&seq, &cp, &sz);
        !           535:                                switch (esc) {
        !           536:                                case ESCAPE_UNICODE:
        !           537:                                        uc = mchars_num2uc(cp + 1, sz - 1);
        !           538:                                        break;
        !           539:                                case ESCAPE_NUMBERED:
        !           540:                                        uc = mchars_num2char(cp, sz);
        !           541:                                        break;
        !           542:                                case ESCAPE_SPECIAL:
        !           543:                                        uc = mchars_spec2cp(cp, sz);
        !           544:                                        break;
        !           545:                                default:
        !           546:                                        uc = -1;
        !           547:                                        break;
        !           548:                                }
        !           549:                        } else
        !           550:                                uc = *seq;
        !           551:                        if (uc < 0x20 || (uc > 0x7E && uc < 0xA0))
        !           552:                                uc = '_';
        !           553:                        if (p->enc == TERMENC_ASCII) {
        !           554:                                cp = ascii_uc2str(uc);
        !           555:                                csz = term_strlen(p, cp);
        !           556:                                ssz = strlen(cp);
        !           557:                        } else
        !           558:                                csz = (*p->width)(p, uc);
        !           559:                        while (lsz >= csz) {
        !           560:                                if (p->enc == TERMENC_ASCII)
        !           561:                                        encode(p, cp, ssz);
        !           562:                                else
        !           563:                                        encode1(p, uc);
        !           564:                                lsz -= csz;
1.121     schwarze  565:                        }
1.93      schwarze  566:                        continue;
1.83      schwarze  567:                case ESCAPE_SKIPCHAR:
1.108     schwarze  568:                        p->flags |= TERMP_BACKAFTER;
1.93      schwarze  569:                        continue;
1.103     schwarze  570:                case ESCAPE_OVERSTRIKE:
                    571:                        cp = seq + sz;
                    572:                        while (seq < cp) {
                    573:                                if (*seq == '\\') {
                    574:                                        mandoc_escape(&seq, NULL, NULL);
                    575:                                        continue;
                    576:                                }
                    577:                                encode1(p, *seq++);
1.108     schwarze  578:                                if (seq < cp) {
                    579:                                        if (p->flags & TERMP_BACKBEFORE)
                    580:                                                p->flags |= TERMP_BACKAFTER;
                    581:                                        else
                    582:                                                p->flags |= TERMP_BACKBEFORE;
                    583:                                }
1.103     schwarze  584:                        }
1.109     schwarze  585:                        /* Trim trailing backspace/blank pair. */
1.118     schwarze  586:                        if (p->col > 2 &&
                    587:                            (p->buf[p->col - 1] == ' ' ||
                    588:                             p->buf[p->col - 1] == '\t'))
1.109     schwarze  589:                                p->col -= 2;
1.108     schwarze  590:                        continue;
1.20      schwarze  591:                default:
1.93      schwarze  592:                        continue;
                    593:                }
                    594:
                    595:                /*
                    596:                 * Common handling for Unicode and numbered
                    597:                 * character escape sequences.
                    598:                 */
                    599:
                    600:                if (p->enc == TERMENC_ASCII) {
                    601:                        cp = ascii_uc2str(uc);
                    602:                        encode(p, cp, strlen(cp));
                    603:                } else {
                    604:                        if ((uc < 0x20 && uc != 0x09) ||
                    605:                            (uc > 0x7E && uc < 0xA0))
                    606:                                uc = 0xFFFD;
                    607:                        encode1(p, uc);
1.20      schwarze  608:                }
                    609:        }
1.75      schwarze  610:        p->flags &= ~TERMP_NBRWORD;
1.1       kristaps  611: }
                    612:
                    613: static void
1.71      schwarze  614: adjbuf(struct termp *p, size_t sz)
1.1       kristaps  615: {
                    616:
1.20      schwarze  617:        if (0 == p->maxcols)
                    618:                p->maxcols = 1024;
                    619:        while (sz >= p->maxcols)
                    620:                p->maxcols <<= 2;
                    621:
1.84      schwarze  622:        p->buf = mandoc_reallocarray(p->buf, p->maxcols, sizeof(int));
1.1       kristaps  623: }
                    624:
1.4       schwarze  625: static void
1.20      schwarze  626: bufferc(struct termp *p, char c)
                    627: {
                    628:
                    629:        if (p->col + 1 >= p->maxcols)
                    630:                adjbuf(p, p->col + 1);
                    631:
1.59      schwarze  632:        p->buf[p->col++] = c;
1.20      schwarze  633: }
                    634:
1.59      schwarze  635: /*
                    636:  * See encode().
                    637:  * Do this for a single (probably unicode) value.
                    638:  * Does not check for non-decorated glyphs.
                    639:  */
                    640: static void
                    641: encode1(struct termp *p, int c)
                    642: {
                    643:        enum termfont     f;
                    644:
1.108     schwarze  645:        if (p->col + 7 >= p->maxcols)
                    646:                adjbuf(p, p->col + 7);
1.59      schwarze  647:
1.115     schwarze  648:        f = (c == ASCII_HYPH || c > 127 || isgraph(c)) ?
1.108     schwarze  649:            p->fontq[p->fonti] : TERMFONT_NONE;
1.59      schwarze  650:
1.108     schwarze  651:        if (p->flags & TERMP_BACKBEFORE) {
1.118     schwarze  652:                if (p->buf[p->col - 1] == ' ' || p->buf[p->col - 1] == '\t')
1.109     schwarze  653:                        p->col--;
                    654:                else
                    655:                        p->buf[p->col++] = 8;
1.108     schwarze  656:                p->flags &= ~TERMP_BACKBEFORE;
                    657:        }
1.70      schwarze  658:        if (TERMFONT_UNDER == f || TERMFONT_BI == f) {
1.59      schwarze  659:                p->buf[p->col++] = '_';
1.70      schwarze  660:                p->buf[p->col++] = 8;
                    661:        }
                    662:        if (TERMFONT_BOLD == f || TERMFONT_BI == f) {
                    663:                if (ASCII_HYPH == c)
                    664:                        p->buf[p->col++] = '-';
                    665:                else
                    666:                        p->buf[p->col++] = c;
                    667:                p->buf[p->col++] = 8;
                    668:        }
1.59      schwarze  669:        p->buf[p->col++] = c;
1.108     schwarze  670:        if (p->flags & TERMP_BACKAFTER) {
                    671:                p->flags |= TERMP_BACKBEFORE;
                    672:                p->flags &= ~TERMP_BACKAFTER;
                    673:        }
1.59      schwarze  674: }
1.20      schwarze  675:
                    676: static void
                    677: encode(struct termp *p, const char *word, size_t sz)
1.4       schwarze  678: {
1.71      schwarze  679:        size_t            i;
1.59      schwarze  680:
1.108     schwarze  681:        if (p->col + 2 + (sz * 5) >= p->maxcols)
                    682:                adjbuf(p, p->col + 2 + (sz * 5));
1.46      schwarze  683:
1.71      schwarze  684:        for (i = 0; i < sz; i++) {
1.70      schwarze  685:                if (ASCII_HYPH == word[i] ||
                    686:                    isgraph((unsigned char)word[i]))
                    687:                        encode1(p, word[i]);
1.119     schwarze  688:                else {
1.59      schwarze  689:                        p->buf[p->col++] = word[i];
1.119     schwarze  690:
                    691:                        /*
                    692:                         * Postpone the effect of \z while handling
                    693:                         * an overstrike sequence from ascii_uc2str().
                    694:                         */
                    695:
                    696:                        if (word[i] == '\b' &&
                    697:                            (p->flags & TERMP_BACKBEFORE)) {
                    698:                                p->flags &= ~TERMP_BACKBEFORE;
                    699:                                p->flags |= TERMP_BACKAFTER;
                    700:                        }
                    701:                }
1.4       schwarze  702:        }
1.80      schwarze  703: }
                    704:
                    705: void
                    706: term_setwidth(struct termp *p, const char *wstr)
                    707: {
                    708:        struct roffsu    su;
1.107     schwarze  709:        int              iop, width;
1.80      schwarze  710:
1.81      schwarze  711:        iop = 0;
                    712:        width = 0;
1.80      schwarze  713:        if (NULL != wstr) {
                    714:                switch (*wstr) {
1.83      schwarze  715:                case '+':
1.80      schwarze  716:                        iop = 1;
                    717:                        wstr++;
                    718:                        break;
1.83      schwarze  719:                case '-':
1.80      schwarze  720:                        iop = -1;
                    721:                        wstr++;
                    722:                        break;
                    723:                default:
                    724:                        break;
                    725:                }
1.81      schwarze  726:                if (a2roffsu(wstr, &su, SCALE_MAX))
                    727:                        width = term_hspan(p, &su);
                    728:                else
1.80      schwarze  729:                        iop = 0;
                    730:        }
                    731:        (*p->setwidth)(p, iop, width);
1.4       schwarze  732: }
1.16      schwarze  733:
                    734: size_t
1.39      schwarze  735: term_len(const struct termp *p, size_t sz)
                    736: {
                    737:
1.112     schwarze  738:        return (*p->width)(p, ' ') * sz;
1.39      schwarze  739: }
                    740:
1.64      schwarze  741: static size_t
                    742: cond_width(const struct termp *p, int c, int *skip)
                    743: {
                    744:
                    745:        if (*skip) {
                    746:                (*skip) = 0;
1.112     schwarze  747:                return 0;
1.64      schwarze  748:        } else
1.112     schwarze  749:                return (*p->width)(p, c);
1.64      schwarze  750: }
1.39      schwarze  751:
                    752: size_t
                    753: term_strlen(const struct termp *p, const char *cp)
                    754: {
1.59      schwarze  755:        size_t           sz, rsz, i;
1.93      schwarze  756:        int              ssz, skip, uc;
1.50      schwarze  757:        const char      *seq, *rhs;
1.59      schwarze  758:        enum mandoc_esc  esc;
1.77      schwarze  759:        static const char rej[] = { '\\', ASCII_NBRSP, ASCII_HYPH,
                    760:                        ASCII_BREAK, '\0' };
1.59      schwarze  761:
                    762:        /*
                    763:         * Account for escaped sequences within string length
                    764:         * calculations.  This follows the logic in term_word() as we
                    765:         * must calculate the width of produced strings.
                    766:         */
                    767:
                    768:        sz = 0;
1.64      schwarze  769:        skip = 0;
1.59      schwarze  770:        while ('\0' != *cp) {
                    771:                rsz = strcspn(cp, rej);
                    772:                for (i = 0; i < rsz; i++)
1.64      schwarze  773:                        sz += cond_width(p, *cp++, &skip);
1.59      schwarze  774:
                    775:                switch (*cp) {
1.83      schwarze  776:                case '\\':
1.59      schwarze  777:                        cp++;
                    778:                        esc = mandoc_escape(&cp, &seq, &ssz);
                    779:                        if (ESCAPE_ERROR == esc)
1.85      schwarze  780:                                continue;
1.59      schwarze  781:
                    782:                        rhs = NULL;
1.50      schwarze  783:
1.59      schwarze  784:                        switch (esc) {
1.83      schwarze  785:                        case ESCAPE_UNICODE:
1.94      schwarze  786:                                uc = mchars_num2uc(seq + 1, ssz - 1);
1.59      schwarze  787:                                break;
1.83      schwarze  788:                        case ESCAPE_NUMBERED:
1.93      schwarze  789:                                uc = mchars_num2char(seq, ssz);
                    790:                                if (uc < 0)
                    791:                                        continue;
1.50      schwarze  792:                                break;
1.83      schwarze  793:                        case ESCAPE_SPECIAL:
1.93      schwarze  794:                                if (p->enc == TERMENC_ASCII) {
1.114     schwarze  795:                                        rhs = mchars_spec2str(seq, ssz, &rsz);
1.93      schwarze  796:                                        if (rhs != NULL)
                    797:                                                break;
                    798:                                } else {
1.114     schwarze  799:                                        uc = mchars_spec2cp(seq, ssz);
1.93      schwarze  800:                                        if (uc > 0)
                    801:                                                sz += cond_width(p, uc, &skip);
1.89      schwarze  802:                                }
1.93      schwarze  803:                                continue;
1.83      schwarze  804:                        case ESCAPE_SKIPCHAR:
1.64      schwarze  805:                                skip = 1;
1.103     schwarze  806:                                continue;
                    807:                        case ESCAPE_OVERSTRIKE:
                    808:                                rsz = 0;
                    809:                                rhs = seq + ssz;
                    810:                                while (seq < rhs) {
                    811:                                        if (*seq == '\\') {
                    812:                                                mandoc_escape(&seq, NULL, NULL);
                    813:                                                continue;
                    814:                                        }
                    815:                                        i = (*p->width)(p, *seq++);
                    816:                                        if (rsz < i)
                    817:                                                rsz = i;
                    818:                                }
                    819:                                sz += rsz;
1.93      schwarze  820:                                continue;
1.50      schwarze  821:                        default:
1.93      schwarze  822:                                continue;
1.50      schwarze  823:                        }
1.39      schwarze  824:
1.93      schwarze  825:                        /*
                    826:                         * Common handling for Unicode and numbered
                    827:                         * character escape sequences.
                    828:                         */
                    829:
                    830:                        if (rhs == NULL) {
                    831:                                if (p->enc == TERMENC_ASCII) {
                    832:                                        rhs = ascii_uc2str(uc);
                    833:                                        rsz = strlen(rhs);
                    834:                                } else {
                    835:                                        if ((uc < 0x20 && uc != 0x09) ||
                    836:                                            (uc > 0x7E && uc < 0xA0))
                    837:                                                uc = 0xFFFD;
                    838:                                        sz += cond_width(p, uc, &skip);
                    839:                                        continue;
                    840:                                }
                    841:                        }
1.59      schwarze  842:
1.64      schwarze  843:                        if (skip) {
                    844:                                skip = 0;
                    845:                                break;
                    846:                        }
1.93      schwarze  847:
                    848:                        /*
                    849:                         * Common handling for all escape sequences
                    850:                         * printing more than one character.
                    851:                         */
1.64      schwarze  852:
1.59      schwarze  853:                        for (i = 0; i < rsz; i++)
                    854:                                sz += (*p->width)(p, *rhs++);
                    855:                        break;
1.83      schwarze  856:                case ASCII_NBRSP:
1.64      schwarze  857:                        sz += cond_width(p, ' ', &skip);
1.55      schwarze  858:                        cp++;
1.59      schwarze  859:                        break;
1.83      schwarze  860:                case ASCII_HYPH:
1.64      schwarze  861:                        sz += cond_width(p, '-', &skip);
1.55      schwarze  862:                        cp++;
1.59      schwarze  863:                        break;
                    864:                default:
                    865:                        break;
                    866:                }
                    867:        }
1.39      schwarze  868:
1.112     schwarze  869:        return sz;
1.39      schwarze  870: }
                    871:
1.100     schwarze  872: int
1.39      schwarze  873: term_vspan(const struct termp *p, const struct roffsu *su)
1.16      schwarze  874: {
                    875:        double           r;
1.101     schwarze  876:        int              ri;
1.16      schwarze  877:
                    878:        switch (su->unit) {
1.99      schwarze  879:        case SCALE_BU:
                    880:                r = su->scale / 40.0;
                    881:                break;
1.83      schwarze  882:        case SCALE_CM:
1.99      schwarze  883:                r = su->scale * 6.0 / 2.54;
                    884:                break;
                    885:        case SCALE_FS:
                    886:                r = su->scale * 65536.0 / 40.0;
1.16      schwarze  887:                break;
1.83      schwarze  888:        case SCALE_IN:
1.86      schwarze  889:                r = su->scale * 6.0;
1.16      schwarze  890:                break;
1.99      schwarze  891:        case SCALE_MM:
                    892:                r = su->scale * 0.006;
                    893:                break;
1.83      schwarze  894:        case SCALE_PC:
1.16      schwarze  895:                r = su->scale;
                    896:                break;
1.83      schwarze  897:        case SCALE_PT:
1.99      schwarze  898:                r = su->scale / 12.0;
1.16      schwarze  899:                break;
1.99      schwarze  900:        case SCALE_EN:
                    901:        case SCALE_EM:
                    902:                r = su->scale * 0.6;
1.16      schwarze  903:                break;
1.83      schwarze  904:        case SCALE_VS:
1.16      schwarze  905:                r = su->scale;
                    906:                break;
                    907:        default:
1.99      schwarze  908:                abort();
1.16      schwarze  909:        }
1.101     schwarze  910:        ri = r > 0.0 ? r + 0.4995 : r - 0.4995;
1.112     schwarze  911:        return ri < 66 ? ri : 1;
1.16      schwarze  912: }
                    913:
1.107     schwarze  914: /*
                    915:  * Convert a scaling width to basic units, rounding down.
                    916:  */
1.100     schwarze  917: int
1.39      schwarze  918: term_hspan(const struct termp *p, const struct roffsu *su)
1.16      schwarze  919: {
                    920:
1.112     schwarze  921:        return (*p->hspan)(p, su);
1.16      schwarze  922: }