src/usr.bin/mandoc/term.c - annotate

Return to term.c CVS log
Up to [local] / src / usr.bin / mandoc
Annotation of src/usr.bin/mandoc/term.c, Revision 1.120

1.120   ! schwarze    1: /*     $OpenBSD: term.c,v 1.119 2017/01/08 18:08:44 schwarze Exp $ */
1.1       kristaps    2: /*
1.59      schwarze    3:  * Copyright (c) 2008, 2009, 2010, 2011 Kristaps Dzonsons <kristaps@bsd.lv>
1.119     schwarze    4:  * Copyright (c) 2010-2017 Ingo Schwarze <schwarze@openbsd.org>
1.1       kristaps    5:  *
                      6:  * Permission to use, copy, modify, and distribute this software for any
1.2       schwarze    7:  * purpose with or without fee is hereby granted, provided that the above
                      8:  * copyright notice and this permission notice appear in all copies.
1.1       kristaps    9:  *
1.106     schwarze   10:  * THE SOFTWARE IS PROVIDED "AS IS" AND THE AUTHORS DISCLAIM ALL WARRANTIES
1.2       schwarze   11:  * WITH REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED WARRANTIES OF
1.106     schwarze   12:  * MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL THE AUTHORS BE LIABLE FOR
1.2       schwarze   13:  * ANY SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL DAMAGES OR ANY DAMAGES
                     14:  * WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN
                     15:  * ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF
                     16:  * OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.
1.1       kristaps   17:  */
1.20      schwarze   18: #include <sys/types.h>
                     19:
1.1       kristaps   20: #include <assert.h>
1.20      schwarze   21: #include <ctype.h>
1.1       kristaps   22: #include <stdio.h>
                     23: #include <stdlib.h>
                     24: #include <string.h>
                     25:
1.34      schwarze   26: #include "mandoc.h"
1.79      schwarze   27: #include "mandoc_aux.h"
1.16      schwarze   28: #include "out.h"
1.1       kristaps   29: #include "term.h"
1.16      schwarze   30: #include "main.h"
1.1       kristaps   31:
1.64      schwarze   32: static size_t           cond_width(const struct termp *, int, int *);
1.71      schwarze   33: static void             adjbuf(struct termp *p, size_t);
1.59      schwarze   34: static void             bufferc(struct termp *, char);
                     35: static void             encode(struct termp *, const char *, size_t);
                     36: static void             encode1(struct termp *, int);
1.1       kristaps   37:
1.83      schwarze   38:
1.37      schwarze   39: void
                     40: term_free(struct termp *p)
1.1       kristaps   41: {
                     42:
1.91      schwarze   43:        free(p->buf);
1.98      schwarze   44:        free(p->fontq);
1.37      schwarze   45:        free(p);
1.1       kristaps   46: }
                     47:
1.13      schwarze   48: void
1.83      schwarze   49: term_begin(struct termp *p, term_margin head,
1.106     schwarze   50:                term_margin foot, const struct roff_meta *arg)
1.1       kristaps   51: {
                     52:
1.37      schwarze   53:        p->headf = head;
                     54:        p->footf = foot;
                     55:        p->argf = arg;
                     56:        (*p->begin)(p);
1.1       kristaps   57: }
                     58:
1.37      schwarze   59: void
                     60: term_end(struct termp *p)
1.1       kristaps   61: {
                     62:
1.37      schwarze   63:        (*p->end)(p);
1.1       kristaps   64: }
                     65:
                     66: /*
1.82      schwarze   67:  * Flush a chunk of text.  By default, break the output line each time
                     68:  * the right margin is reached, and continue output on the next line
                     69:  * at the same offset as the chunk itself.  By default, also break the
                     70:  * output line at the end of the chunk.
1.27      schwarze   71:  * The following flags may be specified:
1.1       kristaps   72:  *
1.82      schwarze   73:  *  - TERMP_NOBREAK: Do not break the output line at the right margin,
                     74:  *    but only at the max right margin.  Also, do not break the output
                     75:  *    line at the end of the chunk, such that the next call can pad to
                     76:  *    the next column.  However, if less than p->trailspace blanks,
                     77:  *    which can be 0, 1, or 2, remain to the right margin, the line
                     78:  *    will be broken.
1.110     schwarze   79:  *  - TERMP_BRTRSP: Consider trailing whitespace significant
                     80:  *    when deciding whether the chunk fits or not.
1.82      schwarze   81:  *  - TERMP_BRIND: If the chunk does not fit and the output line has
                     82:  *    to be broken, start the next line at the right margin instead
                     83:  *    of at the offset.  Used together with TERMP_NOBREAK for the tags
                     84:  *    in various kinds of tagged lists.
                     85:  *  - TERMP_DANGLE: Do not break the output line at the right margin,
                     86:  *    append the next chunk after it even if this one is too long.
                     87:  *    To be used together with TERMP_NOBREAK.
                     88:  *  - TERMP_HANG: Like TERMP_DANGLE, and also suppress padding before
                     89:  *    the next chunk if this column is not full.
1.1       kristaps   90:  */
                     91: void
                     92: term_flushln(struct termp *p)
                     93: {
1.71      schwarze   94:        size_t           i;     /* current input position in p->buf */
1.66      schwarze   95:        int              ntab;  /* number of tabs to prepend */
1.19      schwarze   96:        size_t           vis;   /* current visual position on output */
                     97:        size_t           vbl;   /* number of blanks to prepend to output */
1.33      schwarze   98:        size_t           vend;  /* end of word visual position on output */
1.19      schwarze   99:        size_t           bp;    /* visual right border position */
1.51      schwarze  100:        size_t           dv;    /* temporary for visual pos calculations */
1.71      schwarze  101:        size_t           j;     /* temporary loop index for p->buf */
                    102:        size_t           jhy;   /* last hyph before overflow w/r/t j */
1.42      schwarze  103:        size_t           maxvis; /* output position of visible boundary */
1.1       kristaps  104:
                    105:        /*
                    106:         * First, establish the maximum columns of "visible" content.
                    107:         * This is usually the difference between the right-margin and
                    108:         * an indentation, but can be, for tagged lists or columns, a
1.73      schwarze  109:         * small set of values.
                    110:         *
                    111:         * The following unsigned-signed subtractions look strange,
                    112:         * but they are actually correct.  If the int p->overstep
                    113:         * is negative, it gets sign extended.  Subtracting that
                    114:         * very large size_t effectively adds a small number to dv.
1.1       kristaps  115:         */
1.100     schwarze  116:        dv = p->rmargin > p->offset ? p->rmargin - p->offset : 0;
1.53      schwarze  117:        maxvis = (int)dv > p->overstep ? dv - (size_t)p->overstep : 0;
1.9       schwarze  118:
1.96      schwarze  119:        if (p->flags & TERMP_NOBREAK) {
                    120:                dv = p->maxrmargin > p->offset ?
                    121:                     p->maxrmargin - p->offset : 0;
                    122:                bp = (int)dv > p->overstep ?
                    123:                     dv - (size_t)p->overstep : 0;
                    124:        } else
                    125:                bp = maxvis;
1.19      schwarze  126:
1.33      schwarze  127:        /*
1.61      schwarze  128:         * Calculate the required amount of padding.
1.33      schwarze  129:         */
1.61      schwarze  130:        vbl = p->offset + p->overstep > p->viscol ?
                    131:              p->offset + p->overstep - p->viscol : 0;
1.33      schwarze  132:
1.53      schwarze  133:        vis = vend = 0;
                    134:        i = 0;
1.19      schwarze  135:
1.59      schwarze  136:        while (i < p->col) {
1.22      schwarze  137:                /*
1.42      schwarze  138:                 * Handle literal tab characters: collapse all
                    139:                 * subsequent tabs into a single huge set of spaces.
1.30      schwarze  140:                 */
1.66      schwarze  141:                ntab = 0;
1.120   ! schwarze  142:                while (i < p->col && p->buf[i] == '\t') {
        !           143:                        vend = term_tab_next(vis);
1.30      schwarze  144:                        vbl += vend - vis;
                    145:                        vis = vend;
1.66      schwarze  146:                        ntab++;
1.49      schwarze  147:                        i++;
1.30      schwarze  148:                }
1.22      schwarze  149:
1.1       kristaps  150:                /*
                    151:                 * Count up visible word characters.  Control sequences
                    152:                 * (starting with the CSI) aren't counted.  A space
                    153:                 * generates a non-printing word, which is valid (the
                    154:                 * space is printed according to regular spacing rules).
                    155:                 */
                    156:
1.59      schwarze  157:                for (j = i, jhy = 0; j < p->col; j++) {
1.69      schwarze  158:                        if (' ' == p->buf[j] || '\t' == p->buf[j])
1.1       kristaps  159:                                break;
1.42      schwarze  160:
1.117     krw       161:                        /* Back over the last printed character. */
1.42      schwarze  162:                        if (8 == p->buf[j]) {
                    163:                                assert(j);
                    164:                                vend -= (*p->width)(p, p->buf[j - 1]);
                    165:                                continue;
                    166:                        }
                    167:
                    168:                        /* Regular word. */
                    169:                        /* Break at the hyphen point if we overrun. */
1.83      schwarze  170:                        if (vend > vis && vend < bp &&
1.77      schwarze  171:                            (ASCII_HYPH == p->buf[j] ||
                    172:                             ASCII_BREAK == p->buf[j]))
1.42      schwarze  173:                                jhy = j;
                    174:
1.78      schwarze  175:                        /*
                    176:                         * Hyphenation now decided, put back a real
                    177:                         * hyphen such that we get the correct width.
                    178:                         */
                    179:                        if (ASCII_HYPH == p->buf[j])
                    180:                                p->buf[j] = '-';
                    181:
1.42      schwarze  182:                        vend += (*p->width)(p, p->buf[j]);
1.1       kristaps  183:                }
                    184:
                    185:                /*
1.5       schwarze  186:                 * Find out whether we would exceed the right margin.
1.33      schwarze  187:                 * If so, break to the next line.
1.5       schwarze  188:                 */
1.33      schwarze  189:                if (vend > bp && 0 == jhy && vis > 0) {
1.22      schwarze  190:                        vend -= vis;
1.37      schwarze  191:                        (*p->endline)(p);
1.62      schwarze  192:                        p->viscol = 0;
1.66      schwarze  193:
1.120   ! schwarze  194:                        /* Use pending tabs on the new line. */
        !           195:
        !           196:                        vbl = 0;
        !           197:                        while (ntab--)
        !           198:                                vbl = term_tab_next(vbl);
        !           199:
        !           200:                        /* Re-establish indentation. */
1.66      schwarze  201:
1.120   ! schwarze  202:                        if (p->flags & TERMP_BRIND) {
        !           203:                                vbl += p->rmargin;
        !           204:                                vend += p->rmargin - p->offset;
        !           205:                        } else
        !           206:                                vbl += p->offset;
1.33      schwarze  207:
1.73      schwarze  208:                        /*
                    209:                         * Remove the p->overstep width.
                    210:                         * Again, if p->overstep is negative,
                    211:                         * sign extension does the right thing.
                    212:                         */
1.33      schwarze  213:
1.53      schwarze  214:                        bp += (size_t)p->overstep;
1.26      schwarze  215:                        p->overstep = 0;
1.1       kristaps  216:                }
1.30      schwarze  217:
1.33      schwarze  218:                /* Write out the [remaining] word. */
1.59      schwarze  219:                for ( ; i < p->col; i++) {
1.25      schwarze  220:                        if (vend > bp && jhy > 0 && i > jhy)
1.30      schwarze  221:                                break;
                    222:                        if ('\t' == p->buf[i])
1.1       kristaps  223:                                break;
1.22      schwarze  224:                        if (' ' == p->buf[i]) {
1.46      schwarze  225:                                j = i;
1.88      schwarze  226:                                while (i < p->col && ' ' == p->buf[i])
1.33      schwarze  227:                                        i++;
1.71      schwarze  228:                                dv = (i - j) * (*p->width)(p, ' ');
1.51      schwarze  229:                                vbl += dv;
                    230:                                vend += dv;
1.22      schwarze  231:                                break;
                    232:                        }
1.33      schwarze  233:                        if (ASCII_NBRSP == p->buf[i]) {
1.42      schwarze  234:                                vbl += (*p->width)(p, ' ');
1.33      schwarze  235:                                continue;
                    236:                        }
1.77      schwarze  237:                        if (ASCII_BREAK == p->buf[i])
                    238:                                continue;
1.33      schwarze  239:
                    240:                        /*
                    241:                         * Now we definitely know there will be
                    242:                         * printable characters to output,
                    243:                         * so write preceding white space now.
                    244:                         */
                    245:                        if (vbl) {
1.37      schwarze  246:                                (*p->advance)(p, vbl);
1.33      schwarze  247:                                p->viscol += vbl;
                    248:                                vbl = 0;
1.61      schwarze  249:                        }
                    250:
                    251:                        (*p->letter)(p, p->buf[i]);
                    252:                        if (8 == p->buf[i])
                    253:                                p->viscol -= (*p->width)(p, p->buf[i-1]);
1.83      schwarze  254:                        else
1.42      schwarze  255:                                p->viscol += (*p->width)(p, p->buf[i]);
1.1       kristaps  256:                }
1.22      schwarze  257:                vis = vend;
1.1       kristaps  258:        }
1.48      schwarze  259:
                    260:        /*
                    261:         * If there was trailing white space, it was not printed;
                    262:         * so reset the cursor position accordingly.
                    263:         */
1.95      schwarze  264:        if (vis > vbl)
1.61      schwarze  265:                vis -= vbl;
1.95      schwarze  266:        else
                    267:                vis = 0;
1.18      schwarze  268:
1.9       schwarze  269:        p->col = 0;
1.26      schwarze  270:        p->overstep = 0;
1.108     schwarze  271:        p->flags &= ~(TERMP_BACKAFTER | TERMP_BACKBEFORE);
1.1       kristaps  272:
1.9       schwarze  273:        if ( ! (TERMP_NOBREAK & p->flags)) {
1.29      schwarze  274:                p->viscol = 0;
1.37      schwarze  275:                (*p->endline)(p);
1.1       kristaps  276:                return;
                    277:        }
                    278:
1.9       schwarze  279:        if (TERMP_HANG & p->flags) {
1.102     schwarze  280:                p->overstep += (int)(p->offset + vis - p->rmargin +
1.83      schwarze  281:                    p->trailspace * (*p->width)(p, ' '));
1.9       schwarze  282:
                    283:                /*
                    284:                 * If we have overstepped the margin, temporarily move
                    285:                 * it to the right and flag the rest of the line to be
                    286:                 * shorter.
1.73      schwarze  287:                 * If there is a request to keep the columns together,
                    288:                 * allow negative overstep when the column is not full.
1.9       schwarze  289:                 */
1.73      schwarze  290:                if (p->trailspace && p->overstep < 0)
1.26      schwarze  291:                        p->overstep = 0;
1.61      schwarze  292:                return;
1.9       schwarze  293:
                    294:        } else if (TERMP_DANGLE & p->flags)
                    295:                return;
1.110     schwarze  296:
                    297:        /* Trailing whitespace is significant in some columns. */
                    298:        if (vis && vbl && (TERMP_BRTRSP & p->flags))
                    299:                vis += vbl;
1.1       kristaps  300:
1.61      schwarze  301:        /* If the column was overrun, break the line. */
1.72      schwarze  302:        if (maxvis < vis + p->trailspace * (*p->width)(p, ' ')) {
1.37      schwarze  303:                (*p->endline)(p);
1.61      schwarze  304:                p->viscol = 0;
1.9       schwarze  305:        }
1.1       kristaps  306: }
                    307:
1.83      schwarze  308: /*
1.1       kristaps  309:  * A newline only breaks an existing line; it won't assert vertical
                    310:  * space.  All data in the output buffer is flushed prior to the newline
                    311:  * assertion.
                    312:  */
                    313: void
                    314: term_newln(struct termp *p)
                    315: {
                    316:
                    317:        p->flags |= TERMP_NOSPACE;
1.61      schwarze  318:        if (p->col || p->viscol)
                    319:                term_flushln(p);
1.1       kristaps  320: }
                    321:
                    322: /*
                    323:  * Asserts a vertical space (a full, empty line-break between lines).
                    324:  * Note that if used twice, this will cause two blank spaces and so on.
                    325:  * All data in the output buffer is flushed prior to the newline
                    326:  * assertion.
                    327:  */
                    328: void
                    329: term_vspace(struct termp *p)
                    330: {
                    331:
                    332:        term_newln(p);
1.29      schwarze  333:        p->viscol = 0;
1.63      schwarze  334:        if (0 < p->skipvsp)
                    335:                p->skipvsp--;
                    336:        else
                    337:                (*p->endline)(p);
1.1       kristaps  338: }
                    339:
1.98      schwarze  340: /* Swap current and previous font; for \fP and .ft P */
1.20      schwarze  341: void
                    342: term_fontlast(struct termp *p)
                    343: {
                    344:        enum termfont    f;
1.11      schwarze  345:
1.20      schwarze  346:        f = p->fontl;
                    347:        p->fontl = p->fontq[p->fonti];
                    348:        p->fontq[p->fonti] = f;
                    349: }
                    350:
1.98      schwarze  351: /* Set font, save current, discard previous; for \f, .ft, .B etc. */
1.20      schwarze  352: void
                    353: term_fontrepl(struct termp *p, enum termfont f)
                    354: {
                    355:
                    356:        p->fontl = p->fontq[p->fonti];
                    357:        p->fontq[p->fonti] = f;
1.1       kristaps  358: }
                    359:
1.98      schwarze  360: /* Set font, save previous. */
1.20      schwarze  361: void
                    362: term_fontpush(struct termp *p, enum termfont f)
1.1       kristaps  363: {
1.7       schwarze  364:
1.20      schwarze  365:        p->fontl = p->fontq[p->fonti];
1.98      schwarze  366:        if (++p->fonti == p->fontsz) {
                    367:                p->fontsz += 8;
                    368:                p->fontq = mandoc_reallocarray(p->fontq,
1.116     schwarze  369:                    p->fontsz, sizeof(*p->fontq));
1.98      schwarze  370:        }
                    371:        p->fontq[p->fonti] = f;
1.20      schwarze  372: }
1.1       kristaps  373:
1.98      schwarze  374: /* Flush to make the saved pointer current again. */
1.20      schwarze  375: void
1.104     schwarze  376: term_fontpopq(struct termp *p, int i)
1.20      schwarze  377: {
1.1       kristaps  378:
1.104     schwarze  379:        assert(i >= 0);
                    380:        if (p->fonti > i)
                    381:                p->fonti = i;
1.20      schwarze  382: }
1.1       kristaps  383:
1.98      schwarze  384: /* Pop one font off the stack. */
1.20      schwarze  385: void
                    386: term_fontpop(struct termp *p)
                    387: {
1.1       kristaps  388:
1.20      schwarze  389:        assert(p->fonti);
                    390:        p->fonti--;
1.1       kristaps  391: }
                    392:
                    393: /*
                    394:  * Handle pwords, partial words, which may be either a single word or a
                    395:  * phrase that cannot be broken down (such as a literal string).  This
                    396:  * handles word styling.
                    397:  */
1.7       schwarze  398: void
                    399: term_word(struct termp *p, const char *word)
1.1       kristaps  400: {
1.75      schwarze  401:        const char       nbrsp[2] = { ASCII_NBRSP, 0 };
1.59      schwarze  402:        const char      *seq, *cp;
                    403:        int              sz, uc;
1.20      schwarze  404:        size_t           ssz;
1.59      schwarze  405:        enum mandoc_esc  esc;
1.1       kristaps  406:
1.31      schwarze  407:        if ( ! (TERMP_NOSPACE & p->flags)) {
1.40      schwarze  408:                if ( ! (TERMP_KEEP & p->flags)) {
1.31      schwarze  409:                        bufferc(p, ' ');
1.40      schwarze  410:                        if (TERMP_SENTENCE & p->flags)
                    411:                                bufferc(p, ' ');
                    412:                } else
                    413:                        bufferc(p, ASCII_NBRSP);
1.31      schwarze  414:        }
1.68      schwarze  415:        if (TERMP_PREKEEP & p->flags)
                    416:                p->flags |= TERMP_KEEP;
1.1       kristaps  417:
                    418:        if ( ! (p->flags & TERMP_NONOSPACE))
                    419:                p->flags &= ~TERMP_NOSPACE;
1.46      schwarze  420:        else
                    421:                p->flags |= TERMP_NOSPACE;
1.1       kristaps  422:
1.97      schwarze  423:        p->flags &= ~(TERMP_SENTENCE | TERMP_NONEWLINE);
1.105     schwarze  424:        p->skipvsp = 0;
1.31      schwarze  425:
1.59      schwarze  426:        while ('\0' != *word) {
1.64      schwarze  427:                if ('\\' != *word) {
1.75      schwarze  428:                        if (TERMP_NBRWORD & p->flags) {
                    429:                                if (' ' == *word) {
                    430:                                        encode(p, nbrsp, 1);
                    431:                                        word++;
                    432:                                        continue;
                    433:                                }
                    434:                                ssz = strcspn(word, "\\ ");
                    435:                        } else
                    436:                                ssz = strcspn(word, "\\");
1.45      schwarze  437:                        encode(p, word, ssz);
1.64      schwarze  438:                        word += (int)ssz;
1.20      schwarze  439:                        continue;
1.64      schwarze  440:                }
1.20      schwarze  441:
1.59      schwarze  442:                word++;
                    443:                esc = mandoc_escape(&word, &seq, &sz);
                    444:                if (ESCAPE_ERROR == esc)
1.85      schwarze  445:                        continue;
1.59      schwarze  446:
                    447:                switch (esc) {
1.83      schwarze  448:                case ESCAPE_UNICODE:
1.89      schwarze  449:                        uc = mchars_num2uc(seq + 1, sz - 1);
1.56      schwarze  450:                        break;
1.83      schwarze  451:                case ESCAPE_NUMBERED:
1.93      schwarze  452:                        uc = mchars_num2char(seq, sz);
                    453:                        if (uc < 0)
                    454:                                continue;
1.20      schwarze  455:                        break;
1.83      schwarze  456:                case ESCAPE_SPECIAL:
1.89      schwarze  457:                        if (p->enc == TERMENC_ASCII) {
1.114     schwarze  458:                                cp = mchars_spec2str(seq, sz, &ssz);
1.92      schwarze  459:                                if (cp != NULL)
1.89      schwarze  460:                                        encode(p, cp, ssz);
                    461:                        } else {
1.114     schwarze  462:                                uc = mchars_spec2cp(seq, sz);
1.90      schwarze  463:                                if (uc > 0)
                    464:                                        encode1(p, uc);
1.89      schwarze  465:                        }
1.93      schwarze  466:                        continue;
1.83      schwarze  467:                case ESCAPE_FONTBOLD:
1.20      schwarze  468:                        term_fontrepl(p, TERMFONT_BOLD);
1.93      schwarze  469:                        continue;
1.83      schwarze  470:                case ESCAPE_FONTITALIC:
1.20      schwarze  471:                        term_fontrepl(p, TERMFONT_UNDER);
1.93      schwarze  472:                        continue;
1.83      schwarze  473:                case ESCAPE_FONTBI:
1.70      schwarze  474:                        term_fontrepl(p, TERMFONT_BI);
1.93      schwarze  475:                        continue;
1.83      schwarze  476:                case ESCAPE_FONT:
                    477:                case ESCAPE_FONTROMAN:
1.20      schwarze  478:                        term_fontrepl(p, TERMFONT_NONE);
1.93      schwarze  479:                        continue;
1.83      schwarze  480:                case ESCAPE_FONTPREV:
1.20      schwarze  481:                        term_fontlast(p);
1.93      schwarze  482:                        continue;
1.83      schwarze  483:                case ESCAPE_NOSPACE:
1.108     schwarze  484:                        if (p->flags & TERMP_BACKAFTER)
                    485:                                p->flags &= ~TERMP_BACKAFTER;
                    486:                        else if (*word == '\0')
1.97      schwarze  487:                                p->flags |= (TERMP_NOSPACE | TERMP_NONEWLINE);
1.93      schwarze  488:                        continue;
1.83      schwarze  489:                case ESCAPE_SKIPCHAR:
1.108     schwarze  490:                        p->flags |= TERMP_BACKAFTER;
1.93      schwarze  491:                        continue;
1.103     schwarze  492:                case ESCAPE_OVERSTRIKE:
                    493:                        cp = seq + sz;
                    494:                        while (seq < cp) {
                    495:                                if (*seq == '\\') {
                    496:                                        mandoc_escape(&seq, NULL, NULL);
                    497:                                        continue;
                    498:                                }
                    499:                                encode1(p, *seq++);
1.108     schwarze  500:                                if (seq < cp) {
                    501:                                        if (p->flags & TERMP_BACKBEFORE)
                    502:                                                p->flags |= TERMP_BACKAFTER;
                    503:                                        else
                    504:                                                p->flags |= TERMP_BACKBEFORE;
                    505:                                }
1.103     schwarze  506:                        }
1.109     schwarze  507:                        /* Trim trailing backspace/blank pair. */
1.118     schwarze  508:                        if (p->col > 2 &&
                    509:                            (p->buf[p->col - 1] == ' ' ||
                    510:                             p->buf[p->col - 1] == '\t'))
1.109     schwarze  511:                                p->col -= 2;
1.108     schwarze  512:                        continue;
1.20      schwarze  513:                default:
1.93      schwarze  514:                        continue;
                    515:                }
                    516:
                    517:                /*
                    518:                 * Common handling for Unicode and numbered
                    519:                 * character escape sequences.
                    520:                 */
                    521:
                    522:                if (p->enc == TERMENC_ASCII) {
                    523:                        cp = ascii_uc2str(uc);
                    524:                        encode(p, cp, strlen(cp));
                    525:                } else {
                    526:                        if ((uc < 0x20 && uc != 0x09) ||
                    527:                            (uc > 0x7E && uc < 0xA0))
                    528:                                uc = 0xFFFD;
                    529:                        encode1(p, uc);
1.20      schwarze  530:                }
                    531:        }
1.75      schwarze  532:        p->flags &= ~TERMP_NBRWORD;
1.1       kristaps  533: }
                    534:
                    535: static void
1.71      schwarze  536: adjbuf(struct termp *p, size_t sz)
1.1       kristaps  537: {
                    538:
1.20      schwarze  539:        if (0 == p->maxcols)
                    540:                p->maxcols = 1024;
                    541:        while (sz >= p->maxcols)
                    542:                p->maxcols <<= 2;
                    543:
1.84      schwarze  544:        p->buf = mandoc_reallocarray(p->buf, p->maxcols, sizeof(int));
1.1       kristaps  545: }
                    546:
1.4       schwarze  547: static void
1.20      schwarze  548: bufferc(struct termp *p, char c)
                    549: {
                    550:
                    551:        if (p->col + 1 >= p->maxcols)
                    552:                adjbuf(p, p->col + 1);
                    553:
1.59      schwarze  554:        p->buf[p->col++] = c;
1.20      schwarze  555: }
                    556:
1.59      schwarze  557: /*
                    558:  * See encode().
                    559:  * Do this for a single (probably unicode) value.
                    560:  * Does not check for non-decorated glyphs.
                    561:  */
                    562: static void
                    563: encode1(struct termp *p, int c)
                    564: {
                    565:        enum termfont     f;
                    566:
1.108     schwarze  567:        if (p->col + 7 >= p->maxcols)
                    568:                adjbuf(p, p->col + 7);
1.59      schwarze  569:
1.115     schwarze  570:        f = (c == ASCII_HYPH || c > 127 || isgraph(c)) ?
1.108     schwarze  571:            p->fontq[p->fonti] : TERMFONT_NONE;
1.59      schwarze  572:
1.108     schwarze  573:        if (p->flags & TERMP_BACKBEFORE) {
1.118     schwarze  574:                if (p->buf[p->col - 1] == ' ' || p->buf[p->col - 1] == '\t')
1.109     schwarze  575:                        p->col--;
                    576:                else
                    577:                        p->buf[p->col++] = 8;
1.108     schwarze  578:                p->flags &= ~TERMP_BACKBEFORE;
                    579:        }
1.70      schwarze  580:        if (TERMFONT_UNDER == f || TERMFONT_BI == f) {
1.59      schwarze  581:                p->buf[p->col++] = '_';
1.70      schwarze  582:                p->buf[p->col++] = 8;
                    583:        }
                    584:        if (TERMFONT_BOLD == f || TERMFONT_BI == f) {
                    585:                if (ASCII_HYPH == c)
                    586:                        p->buf[p->col++] = '-';
                    587:                else
                    588:                        p->buf[p->col++] = c;
                    589:                p->buf[p->col++] = 8;
                    590:        }
1.59      schwarze  591:        p->buf[p->col++] = c;
1.108     schwarze  592:        if (p->flags & TERMP_BACKAFTER) {
                    593:                p->flags |= TERMP_BACKBEFORE;
                    594:                p->flags &= ~TERMP_BACKAFTER;
                    595:        }
1.59      schwarze  596: }
1.20      schwarze  597:
                    598: static void
                    599: encode(struct termp *p, const char *word, size_t sz)
1.4       schwarze  600: {
1.71      schwarze  601:        size_t            i;
1.59      schwarze  602:
1.108     schwarze  603:        if (p->col + 2 + (sz * 5) >= p->maxcols)
                    604:                adjbuf(p, p->col + 2 + (sz * 5));
1.46      schwarze  605:
1.71      schwarze  606:        for (i = 0; i < sz; i++) {
1.70      schwarze  607:                if (ASCII_HYPH == word[i] ||
                    608:                    isgraph((unsigned char)word[i]))
                    609:                        encode1(p, word[i]);
1.119     schwarze  610:                else {
1.59      schwarze  611:                        p->buf[p->col++] = word[i];
1.119     schwarze  612:
                    613:                        /*
                    614:                         * Postpone the effect of \z while handling
                    615:                         * an overstrike sequence from ascii_uc2str().
                    616:                         */
                    617:
                    618:                        if (word[i] == '\b' &&
                    619:                            (p->flags & TERMP_BACKBEFORE)) {
                    620:                                p->flags &= ~TERMP_BACKBEFORE;
                    621:                                p->flags |= TERMP_BACKAFTER;
                    622:                        }
                    623:                }
1.4       schwarze  624:        }
1.80      schwarze  625: }
                    626:
                    627: void
                    628: term_setwidth(struct termp *p, const char *wstr)
                    629: {
                    630:        struct roffsu    su;
1.107     schwarze  631:        int              iop, width;
1.80      schwarze  632:
1.81      schwarze  633:        iop = 0;
                    634:        width = 0;
1.80      schwarze  635:        if (NULL != wstr) {
                    636:                switch (*wstr) {
1.83      schwarze  637:                case '+':
1.80      schwarze  638:                        iop = 1;
                    639:                        wstr++;
                    640:                        break;
1.83      schwarze  641:                case '-':
1.80      schwarze  642:                        iop = -1;
                    643:                        wstr++;
                    644:                        break;
                    645:                default:
                    646:                        break;
                    647:                }
1.81      schwarze  648:                if (a2roffsu(wstr, &su, SCALE_MAX))
                    649:                        width = term_hspan(p, &su);
                    650:                else
1.80      schwarze  651:                        iop = 0;
                    652:        }
                    653:        (*p->setwidth)(p, iop, width);
1.4       schwarze  654: }
1.16      schwarze  655:
                    656: size_t
1.39      schwarze  657: term_len(const struct termp *p, size_t sz)
                    658: {
                    659:
1.112     schwarze  660:        return (*p->width)(p, ' ') * sz;
1.39      schwarze  661: }
                    662:
1.64      schwarze  663: static size_t
                    664: cond_width(const struct termp *p, int c, int *skip)
                    665: {
                    666:
                    667:        if (*skip) {
                    668:                (*skip) = 0;
1.112     schwarze  669:                return 0;
1.64      schwarze  670:        } else
1.112     schwarze  671:                return (*p->width)(p, c);
1.64      schwarze  672: }
1.39      schwarze  673:
                    674: size_t
                    675: term_strlen(const struct termp *p, const char *cp)
                    676: {
1.59      schwarze  677:        size_t           sz, rsz, i;
1.93      schwarze  678:        int              ssz, skip, uc;
1.50      schwarze  679:        const char      *seq, *rhs;
1.59      schwarze  680:        enum mandoc_esc  esc;
1.77      schwarze  681:        static const char rej[] = { '\\', ASCII_NBRSP, ASCII_HYPH,
                    682:                        ASCII_BREAK, '\0' };
1.59      schwarze  683:
                    684:        /*
                    685:         * Account for escaped sequences within string length
                    686:         * calculations.  This follows the logic in term_word() as we
                    687:         * must calculate the width of produced strings.
                    688:         */
                    689:
                    690:        sz = 0;
1.64      schwarze  691:        skip = 0;
1.59      schwarze  692:        while ('\0' != *cp) {
                    693:                rsz = strcspn(cp, rej);
                    694:                for (i = 0; i < rsz; i++)
1.64      schwarze  695:                        sz += cond_width(p, *cp++, &skip);
1.59      schwarze  696:
                    697:                switch (*cp) {
1.83      schwarze  698:                case '\\':
1.59      schwarze  699:                        cp++;
                    700:                        esc = mandoc_escape(&cp, &seq, &ssz);
                    701:                        if (ESCAPE_ERROR == esc)
1.85      schwarze  702:                                continue;
1.59      schwarze  703:
                    704:                        rhs = NULL;
1.50      schwarze  705:
1.59      schwarze  706:                        switch (esc) {
1.83      schwarze  707:                        case ESCAPE_UNICODE:
1.94      schwarze  708:                                uc = mchars_num2uc(seq + 1, ssz - 1);
1.59      schwarze  709:                                break;
1.83      schwarze  710:                        case ESCAPE_NUMBERED:
1.93      schwarze  711:                                uc = mchars_num2char(seq, ssz);
                    712:                                if (uc < 0)
                    713:                                        continue;
1.50      schwarze  714:                                break;
1.83      schwarze  715:                        case ESCAPE_SPECIAL:
1.93      schwarze  716:                                if (p->enc == TERMENC_ASCII) {
1.114     schwarze  717:                                        rhs = mchars_spec2str(seq, ssz, &rsz);
1.93      schwarze  718:                                        if (rhs != NULL)
                    719:                                                break;
                    720:                                } else {
1.114     schwarze  721:                                        uc = mchars_spec2cp(seq, ssz);
1.93      schwarze  722:                                        if (uc > 0)
                    723:                                                sz += cond_width(p, uc, &skip);
1.89      schwarze  724:                                }
1.93      schwarze  725:                                continue;
1.83      schwarze  726:                        case ESCAPE_SKIPCHAR:
1.64      schwarze  727:                                skip = 1;
1.103     schwarze  728:                                continue;
                    729:                        case ESCAPE_OVERSTRIKE:
                    730:                                rsz = 0;
                    731:                                rhs = seq + ssz;
                    732:                                while (seq < rhs) {
                    733:                                        if (*seq == '\\') {
                    734:                                                mandoc_escape(&seq, NULL, NULL);
                    735:                                                continue;
                    736:                                        }
                    737:                                        i = (*p->width)(p, *seq++);
                    738:                                        if (rsz < i)
                    739:                                                rsz = i;
                    740:                                }
                    741:                                sz += rsz;
1.93      schwarze  742:                                continue;
1.50      schwarze  743:                        default:
1.93      schwarze  744:                                continue;
1.50      schwarze  745:                        }
1.39      schwarze  746:
1.93      schwarze  747:                        /*
                    748:                         * Common handling for Unicode and numbered
                    749:                         * character escape sequences.
                    750:                         */
                    751:
                    752:                        if (rhs == NULL) {
                    753:                                if (p->enc == TERMENC_ASCII) {
                    754:                                        rhs = ascii_uc2str(uc);
                    755:                                        rsz = strlen(rhs);
                    756:                                } else {
                    757:                                        if ((uc < 0x20 && uc != 0x09) ||
                    758:                                            (uc > 0x7E && uc < 0xA0))
                    759:                                                uc = 0xFFFD;
                    760:                                        sz += cond_width(p, uc, &skip);
                    761:                                        continue;
                    762:                                }
                    763:                        }
1.59      schwarze  764:
1.64      schwarze  765:                        if (skip) {
                    766:                                skip = 0;
                    767:                                break;
                    768:                        }
1.93      schwarze  769:
                    770:                        /*
                    771:                         * Common handling for all escape sequences
                    772:                         * printing more than one character.
                    773:                         */
1.64      schwarze  774:
1.59      schwarze  775:                        for (i = 0; i < rsz; i++)
                    776:                                sz += (*p->width)(p, *rhs++);
                    777:                        break;
1.83      schwarze  778:                case ASCII_NBRSP:
1.64      schwarze  779:                        sz += cond_width(p, ' ', &skip);
1.55      schwarze  780:                        cp++;
1.59      schwarze  781:                        break;
1.83      schwarze  782:                case ASCII_HYPH:
1.64      schwarze  783:                        sz += cond_width(p, '-', &skip);
1.55      schwarze  784:                        cp++;
1.59      schwarze  785:                        break;
                    786:                default:
                    787:                        break;
                    788:                }
                    789:        }
1.39      schwarze  790:
1.112     schwarze  791:        return sz;
1.39      schwarze  792: }
                    793:
1.100     schwarze  794: int
1.39      schwarze  795: term_vspan(const struct termp *p, const struct roffsu *su)
1.16      schwarze  796: {
                    797:        double           r;
1.101     schwarze  798:        int              ri;
1.16      schwarze  799:
                    800:        switch (su->unit) {
1.99      schwarze  801:        case SCALE_BU:
                    802:                r = su->scale / 40.0;
                    803:                break;
1.83      schwarze  804:        case SCALE_CM:
1.99      schwarze  805:                r = su->scale * 6.0 / 2.54;
                    806:                break;
                    807:        case SCALE_FS:
                    808:                r = su->scale * 65536.0 / 40.0;
1.16      schwarze  809:                break;
1.83      schwarze  810:        case SCALE_IN:
1.86      schwarze  811:                r = su->scale * 6.0;
1.16      schwarze  812:                break;
1.99      schwarze  813:        case SCALE_MM:
                    814:                r = su->scale * 0.006;
                    815:                break;
1.83      schwarze  816:        case SCALE_PC:
1.16      schwarze  817:                r = su->scale;
                    818:                break;
1.83      schwarze  819:        case SCALE_PT:
1.99      schwarze  820:                r = su->scale / 12.0;
1.16      schwarze  821:                break;
1.99      schwarze  822:        case SCALE_EN:
                    823:        case SCALE_EM:
                    824:                r = su->scale * 0.6;
1.16      schwarze  825:                break;
1.83      schwarze  826:        case SCALE_VS:
1.16      schwarze  827:                r = su->scale;
                    828:                break;
                    829:        default:
1.99      schwarze  830:                abort();
1.16      schwarze  831:        }
1.101     schwarze  832:        ri = r > 0.0 ? r + 0.4995 : r - 0.4995;
1.112     schwarze  833:        return ri < 66 ? ri : 1;
1.16      schwarze  834: }
                    835:
1.107     schwarze  836: /*
                    837:  * Convert a scaling width to basic units, rounding down.
                    838:  */
1.100     schwarze  839: int
1.39      schwarze  840: term_hspan(const struct termp *p, const struct roffsu *su)
1.16      schwarze  841: {
                    842:
1.112     schwarze  843:        return (*p->hspan)(p, su);
1.16      schwarze  844: }