[BACK]Return to flist.c CVS log [TXT][DIR] Up to [local] / src / usr.bin / rsync

Annotation of src/usr.bin/rsync/flist.c, Revision 1.34.2.1

1.34.2.1! benno       1: /*     $OpenBSD: flist.c,v 1.34 2021/09/02 21:06:06 deraadt Exp $ */
1.1       benno       2: /*
                      3:  * Copyright (c) 2019 Kristaps Dzonsons <kristaps@bsd.lv>
1.16      florian     4:  * Copyright (c) 2019 Florian Obser <florian@openbsd.org>
1.1       benno       5:  *
                      6:  * Permission to use, copy, modify, and distribute this software for any
                      7:  * purpose with or without fee is hereby granted, provided that the above
                      8:  * copyright notice and this permission notice appear in all copies.
                      9:  *
                     10:  * THE SOFTWARE IS PROVIDED "AS IS" AND THE AUTHOR DISCLAIMS ALL WARRANTIES
                     11:  * WITH REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED WARRANTIES OF
                     12:  * MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL THE AUTHOR BE LIABLE FOR
                     13:  * ANY SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL DAMAGES OR ANY DAMAGES
                     14:  * WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN
                     15:  * ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF
                     16:  * OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.
                     17:  */
                     18: #include <sys/stat.h>
                     19:
                     20: #include <assert.h>
                     21: #include <errno.h>
                     22: #include <fcntl.h>
1.7       benno      23: #include <fts.h>
1.34      deraadt    24: #include <limits.h>
1.1       benno      25: #include <inttypes.h>
                     26: #include <search.h>
                     27: #include <stdio.h>
                     28: #include <stdlib.h>
                     29: #include <string.h>
                     30: #include <unistd.h>
                     31:
                     32: #include "extern.h"
                     33:
                     34: /*
                     35:  * We allocate our file list in chunk sizes so as not to do it one by
                     36:  * one.
                     37:  * Preferrably we get one or two allocation.
                     38:  */
                     39: #define        FLIST_CHUNK_SIZE (1024)
                     40:
                     41: /*
                     42:  * These flags are part of the rsync protocol.
                     43:  * They are sent as the first byte for a file transmission and encode
                     44:  * information that affects subsequent transmissions.
                     45:  */
1.19      benno      46: #define FLIST_TOP_LEVEL         0x0001 /* needed for remote --delete */
1.1       benno      47: #define FLIST_MODE_SAME  0x0002 /* mode is repeat */
1.15      florian    48: #define        FLIST_RDEV_SAME  0x0004 /* rdev is repeat */
1.13      florian    49: #define        FLIST_UID_SAME   0x0008 /* uid is repeat */
1.6       benno      50: #define        FLIST_GID_SAME   0x0010 /* gid is repeat */
1.1       benno      51: #define        FLIST_NAME_SAME  0x0020 /* name is repeat */
                     52: #define FLIST_NAME_LONG         0x0040 /* name >255 bytes */
                     53: #define FLIST_TIME_SAME  0x0080 /* time is repeat */
                     54:
                     55: /*
1.27      deraadt    56:  * Required way to sort a filename list.
1.1       benno      57:  */
                     58: static int
                     59: flist_cmp(const void *p1, const void *p2)
                     60: {
                     61:        const struct flist *f1 = p1, *f2 = p2;
                     62:
                     63:        return strcmp(f1->wpath, f2->wpath);
                     64: }
                     65:
                     66: /*
                     67:  * Deduplicate our file list (which may be zero-length).
                     68:  * Returns zero on failure, non-zero on success.
                     69:  */
                     70: static int
1.26      benno      71: flist_dedupe(struct flist **fl, size_t *sz)
1.1       benno      72: {
1.2       benno      73:        size_t           i, j;
1.1       benno      74:        struct flist    *new;
                     75:        struct flist    *f, *fnext;
                     76:
1.5       deraadt    77:        if (*sz == 0)
1.1       benno      78:                return 1;
                     79:
                     80:        /* Create a new buffer, "new", and copy. */
                     81:
                     82:        new = calloc(*sz, sizeof(struct flist));
1.5       deraadt    83:        if (new == NULL) {
1.25      benno      84:                ERR("calloc");
1.1       benno      85:                return 0;
                     86:        }
                     87:
                     88:        for (i = j = 0; i < *sz - 1; i++) {
                     89:                f = &(*fl)[i];
                     90:                fnext = &(*fl)[i + 1];
                     91:
                     92:                if (strcmp(f->wpath, fnext->wpath)) {
                     93:                        new[j++] = *f;
                     94:                        continue;
                     95:                }
                     96:
                     97:                /*
                     98:                 * Our working (destination) paths are the same.
                     99:                 * If the actual file is the same (as given on the
                    100:                 * command-line), then we can just discard the first.
                    101:                 * Otherwise, we need to bail out: it means we have two
                    102:                 * different files with the relative path on the
                    103:                 * destination side.
                    104:                 */
                    105:
1.5       deraadt   106:                if (strcmp(f->path, fnext->path) == 0) {
1.1       benno     107:                        new[j++] = *f;
                    108:                        i++;
1.25      benno     109:                        WARNX("%s: duplicate path: %s",
1.3       benno     110:                            f->wpath, f->path);
1.1       benno     111:                        free(fnext->path);
                    112:                        free(fnext->link);
                    113:                        fnext->path = fnext->link = NULL;
                    114:                        continue;
                    115:                }
                    116:
1.25      benno     117:                ERRX("%s: duplicate working path for "
1.3       benno     118:                    "possibly different file: %s, %s",
                    119:                    f->wpath, f->path, fnext->path);
1.1       benno     120:                free(new);
                    121:                return 0;
                    122:        }
                    123:
                    124:        /* Don't forget the last entry. */
                    125:
                    126:        if (i == *sz - 1)
                    127:                new[j++] = (*fl)[i];
                    128:
                    129:        /*
                    130:         * Reassign to the deduplicated array.
                    131:         * If we started out with *sz > 0, which we check for at the
                    132:         * beginning, then we'll always continue having *sz > 0.
                    133:         */
                    134:
                    135:        free(*fl);
                    136:        *fl = new;
                    137:        *sz = j;
                    138:        assert(*sz);
                    139:        return 1;
                    140: }
                    141:
                    142: /*
                    143:  * We're now going to find our top-level directories.
                    144:  * This only applies to recursive mode.
                    145:  * If we have the first element as the ".", then that's the "top
                    146:  * directory" of our transfer.
                    147:  * Otherwise, mark up all top-level directories in the set.
1.19      benno     148:  * XXX: the FLIST_TOP_LEVEL flag should indicate what is and what isn't
                    149:  * a top-level directory, but I'm not sure if GPL rsync(1) respects it
                    150:  * the same way.
1.1       benno     151:  */
                    152: static void
                    153: flist_topdirs(struct sess *sess, struct flist *fl, size_t flsz)
                    154: {
1.2       benno     155:        size_t           i;
1.1       benno     156:        const char      *cp;
                    157:
1.4       deraadt   158:        if (!sess->opts->recursive)
1.1       benno     159:                return;
                    160:
                    161:        if (flsz && strcmp(fl[0].wpath, ".")) {
                    162:                for (i = 0; i < flsz; i++) {
1.4       deraadt   163:                        if (!S_ISDIR(fl[i].st.mode))
1.1       benno     164:                                continue;
                    165:                        cp = strchr(fl[i].wpath, '/');
1.5       deraadt   166:                        if (cp != NULL && cp[1] != '\0')
1.1       benno     167:                                continue;
                    168:                        fl[i].st.flags |= FLSTAT_TOP_DIR;
1.25      benno     169:                        LOG4("%s: top-level", fl[i].wpath);
1.1       benno     170:                }
                    171:        } else if (flsz) {
                    172:                fl[0].st.flags |= FLSTAT_TOP_DIR;
1.25      benno     173:                LOG4("%s: top-level", fl[0].wpath);
1.1       benno     174:        }
                    175: }
                    176:
                    177: /*
                    178:  * Filter through the fts() file information.
                    179:  * We want directories (pre-order), regular files, and symlinks.
                    180:  * Everything else is skipped and possibly warned about.
                    181:  * Return zero to skip, non-zero to examine.
                    182:  */
                    183: static int
                    184: flist_fts_check(struct sess *sess, FTSENT *ent)
                    185: {
                    186:
1.5       deraadt   187:        if (ent->fts_info == FTS_F  ||
                    188:            ent->fts_info == FTS_D ||
                    189:            ent->fts_info == FTS_SL ||
                    190:            ent->fts_info == FTS_SLNONE)
1.1       benno     191:                return 1;
                    192:
1.5       deraadt   193:        if (ent->fts_info == FTS_DC) {
1.25      benno     194:                WARNX("%s: directory cycle", ent->fts_path);
1.5       deraadt   195:        } else if (ent->fts_info == FTS_DNR) {
1.1       benno     196:                errno = ent->fts_errno;
1.25      benno     197:                WARN("%s: unreadable directory", ent->fts_path);
1.5       deraadt   198:        } else if (ent->fts_info == FTS_DOT) {
1.25      benno     199:                WARNX("%s: skipping dot-file", ent->fts_path);
1.5       deraadt   200:        } else if (ent->fts_info == FTS_ERR) {
1.1       benno     201:                errno = ent->fts_errno;
1.25      benno     202:                WARN("%s", ent->fts_path);
1.5       deraadt   203:        } else if (ent->fts_info == FTS_DEFAULT) {
1.15      florian   204:                if ((sess->opts->devices && (S_ISBLK(ent->fts_statp->st_mode) ||
                    205:                    S_ISCHR(ent->fts_statp->st_mode))) ||
                    206:                    (sess->opts->specials &&
                    207:                    (S_ISFIFO(ent->fts_statp->st_mode) ||
                    208:                    S_ISSOCK(ent->fts_statp->st_mode)))) {
                    209:                        return 1;
                    210:                }
1.25      benno     211:                WARNX("%s: skipping special", ent->fts_path);
1.5       deraadt   212:        } else if (ent->fts_info == FTS_NS) {
1.1       benno     213:                errno = ent->fts_errno;
1.25      benno     214:                WARN("%s: could not stat", ent->fts_path);
1.1       benno     215:        }
                    216:
                    217:        return 0;
                    218: }
                    219:
                    220: /*
                    221:  * Copy necessary elements in "st" into the fields of "f".
                    222:  */
                    223: static void
                    224: flist_copy_stat(struct flist *f, const struct stat *st)
                    225: {
                    226:        f->st.mode = st->st_mode;
                    227:        f->st.uid = st->st_uid;
                    228:        f->st.gid = st->st_gid;
                    229:        f->st.size = st->st_size;
                    230:        f->st.mtime = st->st_mtime;
1.15      florian   231:        f->st.rdev = st->st_rdev;
1.1       benno     232: }
                    233:
                    234: void
                    235: flist_free(struct flist *f, size_t sz)
                    236: {
                    237:        size_t   i;
                    238:
1.5       deraadt   239:        if (f == NULL)
1.1       benno     240:                return;
                    241:
                    242:        for (i = 0; i < sz; i++) {
                    243:                free(f[i].path);
                    244:                free(f[i].link);
                    245:        }
                    246:        free(f);
                    247: }
                    248:
                    249: /*
                    250:  * Serialise our file list (which may be zero-length) to the wire.
                    251:  * Makes sure that the receiver isn't going to block on sending us
                    252:  * return messages on the log channel.
                    253:  * Return zero on failure, non-zero on success.
                    254:  */
                    255: int
1.3       benno     256: flist_send(struct sess *sess, int fdin, int fdout, const struct flist *fl,
                    257:     size_t flsz)
1.1       benno     258: {
1.13      florian   259:        size_t           i, sz, gidsz = 0, uidsz = 0;
1.1       benno     260:        uint8_t          flag;
                    261:        const struct flist *f;
                    262:        const char      *fn;
1.13      florian   263:        struct ident    *gids = NULL, *uids = NULL;
1.7       benno     264:        int              rc = 0;
1.1       benno     265:
                    266:        /* Double-check that we've no pending multiplexed data. */
                    267:
1.25      benno     268:        LOG2("sending file metadata list: %zu", flsz);
1.1       benno     269:
                    270:        for (i = 0; i < flsz; i++) {
                    271:                f = &fl[i];
                    272:                fn = f->wpath;
1.7       benno     273:                sz = strlen(f->wpath);
                    274:                assert(sz > 0);
1.23      deraadt   275:                assert(sz < INT32_MAX);
1.1       benno     276:
1.2       benno     277:                /*
1.1       benno     278:                 * If applicable, unclog the read buffer.
                    279:                 * This happens when the receiver has a lot of log
                    280:                 * messages and all we're doing is sending our file list
                    281:                 * without checking for messages.
                    282:                 */
                    283:
                    284:                if (sess->mplex_reads &&
1.26      benno     285:                    io_read_check(fdin) &&
1.34.2.1! benno     286:                    !io_read_flush(sess, fdin)) {
1.25      benno     287:                        ERRX1("io_read_flush");
1.7       benno     288:                        goto out;
1.1       benno     289:                }
                    290:
                    291:                /*
                    292:                 * For ease, make all of our filenames be "long"
                    293:                 * regardless their actual length.
                    294:                 * This also makes sure that we don't transmit a zero
                    295:                 * byte unintentionally.
                    296:                 */
                    297:
                    298:                flag = FLIST_NAME_LONG;
1.19      benno     299:                if ((FLSTAT_TOP_DIR & f->st.flags))
                    300:                        flag |= FLIST_TOP_LEVEL;
1.1       benno     301:
1.25      benno     302:                LOG3("%s: sending file metadata: "
1.1       benno     303:                        "size %jd, mtime %jd, mode %o",
                    304:                        fn, (intmax_t)f->st.size,
                    305:                        (intmax_t)f->st.mtime, f->st.mode);
                    306:
                    307:                /* Now write to the wire. */
                    308:                /* FIXME: buffer this. */
                    309:
1.4       deraadt   310:                if (!io_write_byte(sess, fdout, flag)) {
1.25      benno     311:                        ERRX1("io_write_byte");
1.7       benno     312:                        goto out;
                    313:                } else if (!io_write_int(sess, fdout, sz)) {
1.25      benno     314:                        ERRX1("io_write_int");
1.7       benno     315:                        goto out;
                    316:                } else if (!io_write_buf(sess, fdout, fn, sz)) {
1.25      benno     317:                        ERRX1("io_write_buf");
1.7       benno     318:                        goto out;
1.4       deraadt   319:                } else if (!io_write_long(sess, fdout, f->st.size)) {
1.25      benno     320:                        ERRX1("io_write_long");
1.7       benno     321:                        goto out;
1.23      deraadt   322:                } else if (!io_write_uint(sess, fdout, (uint32_t)f->st.mtime)) {
1.25      benno     323:                        ERRX1("io_write_uint");
1.7       benno     324:                        goto out;
1.23      deraadt   325:                } else if (!io_write_uint(sess, fdout, f->st.mode)) {
1.25      benno     326:                        ERRX1("io_write_uint");
1.7       benno     327:                        goto out;
1.1       benno     328:                }
                    329:
1.13      florian   330:                /* Conditional part: uid. */
                    331:
                    332:                if (sess->opts->preserve_uids) {
1.23      deraadt   333:                        if (!io_write_uint(sess, fdout, f->st.uid)) {
1.25      benno     334:                                ERRX1("io_write_uint");
1.13      florian   335:                                goto out;
                    336:                        }
1.26      benno     337:                        if (!idents_add(0, &uids, &uidsz, f->st.uid)) {
1.25      benno     338:                                ERRX1("idents_add");
1.13      florian   339:                                goto out;
                    340:                        }
                    341:                }
                    342:
1.6       benno     343:                /* Conditional part: gid. */
                    344:
1.7       benno     345:                if (sess->opts->preserve_gids) {
1.23      deraadt   346:                        if (!io_write_uint(sess, fdout, f->st.gid)) {
1.25      benno     347:                                ERRX1("io_write_uint");
1.7       benno     348:                                goto out;
1.12      benno     349:                        }
1.26      benno     350:                        if (!idents_add(1, &gids, &gidsz, f->st.gid)) {
1.25      benno     351:                                ERRX1("idents_add");
1.7       benno     352:                                goto out;
                    353:                        }
1.6       benno     354:                }
                    355:
1.17      florian   356:                /* Conditional part: devices & special files. */
                    357:
                    358:                if ((sess->opts->devices && (S_ISBLK(f->st.mode) ||
1.34.2.1! benno     359:                    S_ISCHR(f->st.mode))) ||
1.17      florian   360:                    (sess->opts->specials && (S_ISFIFO(f->st.mode) ||
                    361:                    S_ISSOCK(f->st.mode)))) {
                    362:                        if (!io_write_int(sess, fdout, f->st.rdev)) {
1.25      benno     363:                                ERRX1("io_write_int");
1.17      florian   364:                                goto out;
                    365:                        }
                    366:                }
                    367:
1.6       benno     368:                /* Conditional part: link. */
1.1       benno     369:
                    370:                if (S_ISLNK(f->st.mode) &&
                    371:                    sess->opts->preserve_links) {
                    372:                        fn = f->link;
1.7       benno     373:                        sz = strlen(f->link);
1.23      deraadt   374:                        assert(sz < INT32_MAX);
1.7       benno     375:                        if (!io_write_int(sess, fdout, sz)) {
1.25      benno     376:                                ERRX1("io_write_int");
1.7       benno     377:                                goto out;
1.1       benno     378:                        }
1.7       benno     379:                        if (!io_write_buf(sess, fdout, fn, sz)) {
1.25      benno     380:                                ERRX1("io_write_buf");
1.7       benno     381:                                goto out;
1.1       benno     382:                        }
                    383:                }
                    384:
                    385:                if (S_ISREG(f->st.mode))
                    386:                        sess->total_size += f->st.size;
                    387:        }
                    388:
1.7       benno     389:        /* Signal end of file list. */
                    390:
1.4       deraadt   391:        if (!io_write_byte(sess, fdout, 0)) {
1.25      benno     392:                ERRX1("io_write_byte");
1.7       benno     393:                goto out;
                    394:        }
                    395:
1.13      florian   396:        /* Conditionally write identifier lists. */
                    397:
1.18      benno     398:        if (sess->opts->preserve_uids && !sess->opts->numeric_ids) {
1.25      benno     399:                LOG2("sending uid list: %zu", uidsz);
1.13      florian   400:                if (!idents_send(sess, fdout, uids, uidsz)) {
1.25      benno     401:                        ERRX1("idents_send");
1.13      florian   402:                        goto out;
                    403:                }
                    404:        }
1.7       benno     405:
1.18      benno     406:        if (sess->opts->preserve_gids && !sess->opts->numeric_ids) {
1.25      benno     407:                LOG2("sending gid list: %zu", gidsz);
1.8       benno     408:                if (!idents_send(sess, fdout, gids, gidsz)) {
1.25      benno     409:                        ERRX1("idents_send");
1.7       benno     410:                        goto out;
                    411:                }
1.1       benno     412:        }
                    413:
1.7       benno     414:        rc = 1;
                    415: out:
1.8       benno     416:        idents_free(gids, gidsz);
1.13      florian   417:        idents_free(uids, uidsz);
1.7       benno     418:        return rc;
1.1       benno     419: }
                    420:
                    421: /*
                    422:  * Read the filename of a file list.
                    423:  * This is the most expensive part of the file list transfer, so a lot
                    424:  * of attention has gone into transmitting as little as possible.
                    425:  * Micro-optimisation, but whatever.
                    426:  * Fills in "f" with the full path on success.
                    427:  * Returns zero on failure, non-zero on success.
                    428:  */
                    429: static int
1.3       benno     430: flist_recv_name(struct sess *sess, int fd, struct flist *f, uint8_t flags,
1.34      deraadt   431:     char last[PATH_MAX])
1.1       benno     432: {
                    433:        uint8_t          bval;
                    434:        size_t           partial = 0;
                    435:        size_t           pathlen = 0, len;
                    436:
                    437:        /*
                    438:         * Read our filename.
                    439:         * If we have FLIST_NAME_SAME, we inherit some of the last
                    440:         * transmitted name.
                    441:         * If we have FLIST_NAME_LONG, then the string length is greater
                    442:         * than byte-size.
                    443:         */
                    444:
                    445:        if (FLIST_NAME_SAME & flags) {
1.4       deraadt   446:                if (!io_read_byte(sess, fd, &bval)) {
1.25      benno     447:                        ERRX1("io_read_byte");
1.1       benno     448:                        return 0;
                    449:                }
                    450:                partial = bval;
                    451:        }
                    452:
                    453:        /* Get the (possibly-remaining) filename length. */
                    454:
                    455:        if (FLIST_NAME_LONG & flags) {
1.4       deraadt   456:                if (!io_read_size(sess, fd, &pathlen)) {
1.25      benno     457:                        ERRX1("io_read_size");
1.1       benno     458:                        return 0;
                    459:                }
                    460:        } else {
1.4       deraadt   461:                if (!io_read_byte(sess, fd, &bval)) {
1.25      benno     462:                        ERRX1("io_read_byte");
1.1       benno     463:                        return 0;
                    464:                }
                    465:                pathlen = bval;
                    466:        }
                    467:
                    468:        /* Allocate our full filename length. */
                    469:        /* FIXME: maximum pathname length. */
                    470:
1.5       deraadt   471:        if ((len = pathlen + partial) == 0) {
1.25      benno     472:                ERRX("security violation: zero-length pathname");
1.1       benno     473:                return 0;
                    474:        }
                    475:
1.5       deraadt   476:        if ((f->path = malloc(len + 1)) == NULL) {
1.25      benno     477:                ERR("malloc");
1.1       benno     478:                return 0;
                    479:        }
                    480:        f->path[len] = '\0';
                    481:
                    482:        if (FLIST_NAME_SAME & flags)
                    483:                memcpy(f->path, last, partial);
                    484:
1.4       deraadt   485:        if (!io_read_buf(sess, fd, f->path + partial, pathlen)) {
1.25      benno     486:                ERRX1("io_read_buf");
1.1       benno     487:                return 0;
                    488:        }
                    489:
1.5       deraadt   490:        if (f->path[0] == '/') {
1.25      benno     491:                ERRX("security violation: absolute pathname: %s",
1.21      deraadt   492:                    f->path);
1.1       benno     493:                return 0;
                    494:        }
                    495:
1.5       deraadt   496:        if (strstr(f->path, "/../") != NULL ||
                    497:            (len > 2 && strcmp(f->path + len - 3, "/..") == 0) ||
                    498:            (len > 2 && strncmp(f->path, "../", 3) == 0) ||
                    499:            strcmp(f->path, "..") == 0) {
1.25      benno     500:                ERRX("%s: security violation: backtracking pathname",
1.21      deraadt   501:                    f->path);
1.1       benno     502:                return 0;
                    503:        }
                    504:
                    505:        /* Record our last path and construct our filename. */
                    506:
1.34      deraadt   507:        strlcpy(last, f->path, PATH_MAX);
1.1       benno     508:        f->wpath = f->path;
                    509:        return 1;
                    510: }
                    511:
                    512: /*
                    513:  * Reallocate a file list in chunks of FLIST_CHUNK_SIZE;
                    514:  * Returns zero on failure, non-zero on success.
                    515:  */
                    516: static int
1.26      benno     517: flist_realloc(struct flist **fl, size_t *sz, size_t *max)
1.1       benno     518: {
                    519:        void    *pp;
                    520:
                    521:        if (*sz + 1 <= *max)  {
                    522:                (*sz)++;
                    523:                return 1;
                    524:        }
                    525:
                    526:        pp = recallocarray(*fl, *max,
                    527:                *max + FLIST_CHUNK_SIZE, sizeof(struct flist));
1.5       deraadt   528:        if (pp == NULL) {
1.25      benno     529:                ERR("recallocarray");
1.1       benno     530:                return 0;
                    531:        }
                    532:        *fl = pp;
                    533:        *max += FLIST_CHUNK_SIZE;
                    534:        (*sz)++;
                    535:        return 1;
                    536: }
                    537:
                    538: /*
                    539:  * Copy a regular or symbolic link file "path" into "f".
                    540:  * This handles the correct path creation and symbolic linking.
                    541:  * Returns zero on failure, non-zero on success.
                    542:  */
                    543: static int
1.26      benno     544: flist_append(struct flist *f, struct stat *st, const char *path)
1.1       benno     545: {
                    546:
                    547:        /*
                    548:         * Copy the full path for local addressing and transmit
                    549:         * only the filename part for the receiver.
                    550:         */
                    551:
1.5       deraadt   552:        if ((f->path = strdup(path)) == NULL) {
1.25      benno     553:                ERR("strdup");
1.1       benno     554:                return 0;
                    555:        }
                    556:
1.5       deraadt   557:        if ((f->wpath = strrchr(f->path, '/')) == NULL)
1.1       benno     558:                f->wpath = f->path;
                    559:        else
                    560:                f->wpath++;
                    561:
                    562:        /*
                    563:         * On the receiving end, we'll strip out all bits on the
                    564:         * mode except for the file permissions.
                    565:         * No need to warn about it here.
                    566:         */
                    567:
                    568:        flist_copy_stat(f, st);
                    569:
                    570:        /* Optionally copy link information. */
                    571:
                    572:        if (S_ISLNK(st->st_mode)) {
1.26      benno     573:                f->link = symlink_read(f->path);
1.5       deraadt   574:                if (f->link == NULL) {
1.25      benno     575:                        ERRX1("symlink_read");
1.1       benno     576:                        return 0;
                    577:                }
                    578:        }
                    579:
                    580:        return 1;
                    581: }
                    582:
                    583: /*
                    584:  * Receive a file list from the wire, filling in length "sz" (which may
                    585:  * possibly be zero) and list "flp" on success.
                    586:  * Return zero on failure, non-zero on success.
                    587:  */
                    588: int
                    589: flist_recv(struct sess *sess, int fd, struct flist **flp, size_t *sz)
                    590: {
                    591:        struct flist    *fl = NULL;
                    592:        struct flist    *ff;
                    593:        const struct flist *fflast = NULL;
1.13      florian   594:        size_t           flsz = 0, flmax = 0, lsz, gidsz = 0, uidsz = 0;
1.1       benno     595:        uint8_t          flag;
1.34      deraadt   596:        char             last[PATH_MAX];
1.23      deraadt   597:        int64_t          lval; /* temporary values... */
1.1       benno     598:        int32_t          ival;
1.22      deraadt   599:        uint32_t         uival;
1.13      florian   600:        struct ident    *gids = NULL, *uids = NULL;
1.1       benno     601:
                    602:        last[0] = '\0';
                    603:
                    604:        for (;;) {
1.4       deraadt   605:                if (!io_read_byte(sess, fd, &flag)) {
1.25      benno     606:                        ERRX1("io_read_byte");
1.1       benno     607:                        goto out;
1.5       deraadt   608:                } else if (flag == 0)
1.1       benno     609:                        break;
                    610:
1.26      benno     611:                if (!flist_realloc(&fl, &flsz, &flmax)) {
1.25      benno     612:                        ERRX1("flist_realloc");
1.1       benno     613:                        goto out;
                    614:                }
                    615:
                    616:                ff = &fl[flsz - 1];
                    617:                fflast = flsz > 1 ? &fl[flsz - 2] : NULL;
                    618:
                    619:                /* Filename first. */
                    620:
1.4       deraadt   621:                if (!flist_recv_name(sess, fd, ff, flag, last)) {
1.25      benno     622:                        ERRX1("flist_recv_name");
1.1       benno     623:                        goto out;
                    624:                }
                    625:
                    626:                /* Read the file size. */
                    627:
1.23      deraadt   628:                if (!io_read_long(sess, fd, &lval)) {
1.25      benno     629:                        ERRX1("io_read_long");
1.1       benno     630:                        goto out;
                    631:                }
                    632:                ff->st.size = lval;
                    633:
                    634:                /* Read the modification time. */
                    635:
1.4       deraadt   636:                if (!(FLIST_TIME_SAME & flag)) {
1.23      deraadt   637:                        if (!io_read_uint(sess, fd, &uival)) {
1.30      claudio   638:                                ERRX1("io_read_uint");
1.1       benno     639:                                goto out;
                    640:                        }
1.22      deraadt   641:                        ff->st.mtime = uival;   /* beyond 2038 */
1.5       deraadt   642:                } else if (fflast == NULL) {
1.25      benno     643:                        ERRX("same time without last entry");
1.1       benno     644:                        goto out;
                    645:                }  else
                    646:                        ff->st.mtime = fflast->st.mtime;
                    647:
                    648:                /* Read the file mode. */
                    649:
1.4       deraadt   650:                if (!(FLIST_MODE_SAME & flag)) {
1.23      deraadt   651:                        if (!io_read_uint(sess, fd, &uival)) {
1.30      claudio   652:                                ERRX1("io_read_uint");
1.1       benno     653:                                goto out;
                    654:                        }
1.23      deraadt   655:                        ff->st.mode = uival;
1.5       deraadt   656:                } else if (fflast == NULL) {
1.25      benno     657:                        ERRX("same mode without last entry");
1.1       benno     658:                        goto out;
                    659:                } else
                    660:                        ff->st.mode = fflast->st.mode;
                    661:
1.13      florian   662:                /* Conditional part: uid. */
                    663:
                    664:                if (sess->opts->preserve_uids) {
                    665:                        if (!(FLIST_UID_SAME & flag)) {
1.23      deraadt   666:                                if (!io_read_uint(sess, fd, &uival)) {
1.25      benno     667:                                        ERRX1("io_read_int");
1.13      florian   668:                                        goto out;
                    669:                                }
1.23      deraadt   670:                                ff->st.uid = uival;
1.13      florian   671:                        } else if (fflast == NULL) {
1.25      benno     672:                                ERRX("same uid without last entry");
1.13      florian   673:                                goto out;
                    674:                        } else
                    675:                                ff->st.uid = fflast->st.uid;
                    676:                }
                    677:
1.6       benno     678:                /* Conditional part: gid. */
                    679:
                    680:                if (sess->opts->preserve_gids) {
1.11      benno     681:                        if (!(FLIST_GID_SAME & flag)) {
1.23      deraadt   682:                                if (!io_read_uint(sess, fd, &uival)) {
1.30      claudio   683:                                        ERRX1("io_read_uint");
1.6       benno     684:                                        goto out;
                    685:                                }
1.23      deraadt   686:                                ff->st.gid = uival;
1.11      benno     687:                        } else if (fflast == NULL) {
1.25      benno     688:                                ERRX("same gid without last entry");
1.6       benno     689:                                goto out;
                    690:                        } else
                    691:                                ff->st.gid = fflast->st.gid;
                    692:                }
                    693:
1.17      florian   694:                /* Conditional part: devices & special files. */
1.15      florian   695:
                    696:                if ((sess->opts->devices && (S_ISBLK(ff->st.mode) ||
1.34.2.1! benno     697:                    S_ISCHR(ff->st.mode))) ||
1.15      florian   698:                    (sess->opts->specials && (S_ISFIFO(ff->st.mode) ||
                    699:                    S_ISSOCK(ff->st.mode)))) {
                    700:                        if (!(FLIST_RDEV_SAME & flag)) {
                    701:                                if (!io_read_int(sess, fd, &ival)) {
1.25      benno     702:                                        ERRX1("io_read_int");
1.15      florian   703:                                        goto out;
                    704:                                }
                    705:                                ff->st.rdev = ival;
                    706:                        } else if (fflast == NULL) {
1.25      benno     707:                                ERRX("same device without last entry");
1.15      florian   708:                                goto out;
                    709:                        } else
                    710:                                ff->st.rdev = fflast->st.rdev;
                    711:                }
                    712:
1.6       benno     713:                /* Conditional part: link. */
1.1       benno     714:
                    715:                if (S_ISLNK(ff->st.mode) &&
                    716:                    sess->opts->preserve_links) {
1.4       deraadt   717:                        if (!io_read_size(sess, fd, &lsz)) {
1.25      benno     718:                                ERRX1("io_read_size");
1.1       benno     719:                                goto out;
1.5       deraadt   720:                        } else if (lsz == 0) {
1.25      benno     721:                                ERRX("empty link name");
1.1       benno     722:                                goto out;
                    723:                        }
                    724:                        ff->link = calloc(lsz + 1, 1);
1.5       deraadt   725:                        if (ff->link == NULL) {
1.25      benno     726:                                ERR("calloc");
1.1       benno     727:                                goto out;
                    728:                        }
1.4       deraadt   729:                        if (!io_read_buf(sess, fd, ff->link, lsz)) {
1.25      benno     730:                                ERRX1("io_read_buf");
1.1       benno     731:                                goto out;
                    732:                        }
                    733:                }
                    734:
1.25      benno     735:                LOG3("%s: received file metadata: "
1.15      florian   736:                        "size %jd, mtime %jd, mode %o, rdev (%d, %d)",
1.1       benno     737:                        ff->path, (intmax_t)ff->st.size,
1.15      florian   738:                        (intmax_t)ff->st.mtime, ff->st.mode,
                    739:                        major(ff->st.rdev), minor(ff->st.rdev));
1.1       benno     740:
                    741:                if (S_ISREG(ff->st.mode))
                    742:                        sess->total_size += ff->st.size;
                    743:        }
                    744:
1.13      florian   745:        /* Conditionally read the user/group list. */
                    746:
1.18      benno     747:        if (sess->opts->preserve_uids && !sess->opts->numeric_ids) {
1.13      florian   748:                if (!idents_recv(sess, fd, &uids, &uidsz)) {
1.25      benno     749:                        ERRX1("idents_recv");
1.13      florian   750:                        goto out;
                    751:                }
1.25      benno     752:                LOG2("received uid list: %zu", uidsz);
1.13      florian   753:        }
1.7       benno     754:
1.18      benno     755:        if (sess->opts->preserve_gids && !sess->opts->numeric_ids) {
1.8       benno     756:                if (!idents_recv(sess, fd, &gids, &gidsz)) {
1.25      benno     757:                        ERRX1("idents_recv");
1.7       benno     758:                        goto out;
                    759:                }
1.25      benno     760:                LOG2("received gid list: %zu", gidsz);
1.7       benno     761:        }
                    762:
1.1       benno     763:        /* Remember to order the received list. */
                    764:
1.25      benno     765:        LOG2("received file metadata list: %zu", flsz);
1.1       benno     766:        qsort(fl, flsz, sizeof(struct flist), flist_cmp);
                    767:        flist_topdirs(sess, fl, flsz);
                    768:        *sz = flsz;
                    769:        *flp = fl;
1.7       benno     770:
1.13      florian   771:        /* Conditionally remap and reassign identifiers. */
                    772:
1.18      benno     773:        if (sess->opts->preserve_uids && !sess->opts->numeric_ids) {
1.13      florian   774:                idents_remap(sess, 0, uids, uidsz);
                    775:                idents_assign_uid(sess, fl, flsz, uids, uidsz);
                    776:        }
1.7       benno     777:
1.18      benno     778:        if (sess->opts->preserve_gids && !sess->opts->numeric_ids) {
1.13      florian   779:                idents_remap(sess, 1, gids, gidsz);
                    780:                idents_assign_gid(sess, fl, flsz, gids, gidsz);
1.7       benno     781:        }
                    782:
1.8       benno     783:        idents_free(gids, gidsz);
1.13      florian   784:        idents_free(uids, uidsz);
1.1       benno     785:        return 1;
                    786: out:
                    787:        flist_free(fl, flsz);
1.8       benno     788:        idents_free(gids, gidsz);
1.13      florian   789:        idents_free(uids, uidsz);
1.1       benno     790:        *sz = 0;
                    791:        *flp = NULL;
                    792:        return 0;
                    793: }
                    794:
                    795: /*
                    796:  * Generate a flist possibly-recursively given a file root, which may
                    797:  * also be a regular file or symlink.
                    798:  * On success, augments the generated list in "flp" of length "sz".
                    799:  * Returns zero on failure, non-zero on success.
                    800:  */
                    801: static int
1.3       benno     802: flist_gen_dirent(struct sess *sess, char *root, struct flist **fl, size_t *sz,
                    803:     size_t *max)
1.1       benno     804: {
                    805:        char            *cargv[2], *cp;
1.28      benno     806:        int              rc = 0, flag;
1.1       benno     807:        FTS             *fts;
                    808:        FTSENT          *ent;
                    809:        struct flist    *f;
1.28      benno     810:        size_t           i, flsz = 0, nxdev = 0, stripdir;
                    811:        dev_t           *newxdev, *xdev = NULL;
1.1       benno     812:        struct stat      st;
                    813:
                    814:        cargv[0] = root;
                    815:        cargv[1] = NULL;
                    816:
                    817:        /*
                    818:         * If we're a file, then revert to the same actions we use for
                    819:         * the non-recursive scan.
                    820:         */
                    821:
1.5       deraadt   822:        if (lstat(root, &st) == -1) {
1.25      benno     823:                ERR("%s: lstat", root);
1.1       benno     824:                return 0;
                    825:        } else if (S_ISREG(st.st_mode)) {
1.33      claudio   826:                /* filter files */
                    827:                if (rules_match(root, 0) == -1) {
                    828:                        WARNX("%s: skipping excluded file", root);
                    829:                        return 1;
                    830:                }
1.26      benno     831:                if (!flist_realloc(fl, sz, max)) {
1.25      benno     832:                        ERRX1("flist_realloc");
1.1       benno     833:                        return 0;
                    834:                }
                    835:                f = &(*fl)[(*sz) - 1];
1.5       deraadt   836:                assert(f != NULL);
1.1       benno     837:
1.26      benno     838:                if (!flist_append(f, &st, root)) {
1.25      benno     839:                        ERRX1("flist_append");
1.1       benno     840:                        return 0;
1.10      benno     841:                }
1.1       benno     842:                return 1;
                    843:        } else if (S_ISLNK(st.st_mode)) {
1.4       deraadt   844:                if (!sess->opts->preserve_links) {
1.25      benno     845:                        WARNX("%s: skipping symlink", root);
1.1       benno     846:                        return 1;
1.33      claudio   847:                }
                    848:                /* filter files */
                    849:                if (rules_match(root, 0) == -1) {
                    850:                        WARNX("%s: skipping excluded symlink", root);
                    851:                        return 1;
                    852:                }
                    853:                if (!flist_realloc(fl, sz, max)) {
1.25      benno     854:                        ERRX1("flist_realloc");
1.1       benno     855:                        return 0;
                    856:                }
                    857:                f = &(*fl)[(*sz) - 1];
1.5       deraadt   858:                assert(f != NULL);
1.1       benno     859:
1.26      benno     860:                if (!flist_append(f, &st, root)) {
1.25      benno     861:                        ERRX1("flist_append");
1.1       benno     862:                        return 0;
1.10      benno     863:                }
1.1       benno     864:                return 1;
1.4       deraadt   865:        } else if (!S_ISDIR(st.st_mode)) {
1.25      benno     866:                WARNX("%s: skipping special", root);
1.1       benno     867:                return 1;
                    868:        }
                    869:
                    870:        /*
                    871:         * If we end with a slash, it means that we're not supposed to
                    872:         * copy the directory part itself---only the contents.
                    873:         * So set "stripdir" to be what we take out.
                    874:         */
                    875:
                    876:        stripdir = strlen(root);
                    877:        assert(stripdir > 0);
1.5       deraadt   878:        if (root[stripdir - 1] != '/')
1.1       benno     879:                stripdir = 0;
                    880:
                    881:        /*
                    882:         * If we're not stripping anything, then see if we need to strip
                    883:         * out the leading material in the path up to and including the
                    884:         * last directory component.
                    885:         */
                    886:
1.5       deraadt   887:        if (stripdir == 0)
                    888:                if ((cp = strrchr(root, '/')) != NULL)
1.1       benno     889:                        stripdir = cp - root + 1;
                    890:
                    891:        /*
                    892:         * If we're recursive, then we need to take down all of the
                    893:         * files and directory components, so use fts(3).
                    894:         * Copying the information file-by-file into the flstat.
                    895:         * We'll make sense of it in flist_send.
                    896:         */
                    897:
1.5       deraadt   898:        if ((fts = fts_open(cargv, FTS_PHYSICAL, NULL)) == NULL) {
1.25      benno     899:                ERR("fts_open");
1.1       benno     900:                return 0;
                    901:        }
                    902:
                    903:        errno = 0;
1.5       deraadt   904:        while ((ent = fts_read(fts)) != NULL) {
1.4       deraadt   905:                if (!flist_fts_check(sess, ent)) {
1.1       benno     906:                        errno = 0;
                    907:                        continue;
                    908:                }
                    909:
                    910:                /* We don't allow symlinks without -l. */
                    911:
1.5       deraadt   912:                assert(ent->fts_statp != NULL);
1.1       benno     913:                if (S_ISLNK(ent->fts_statp->st_mode) &&
1.4       deraadt   914:                    !sess->opts->preserve_links) {
1.25      benno     915:                        WARNX("%s: skipping symlink", ent->fts_path);
1.1       benno     916:                        continue;
                    917:                }
                    918:
1.24      bket      919:                /*
                    920:                 * If rsync is told to avoid crossing a filesystem
                    921:                 * boundary when recursing, then replace all mount point
                    922:                 * directories with empty directories.  The latter is
                    923:                 * prevented by telling rsync multiple times to avoid
                    924:                 * crossing a filesystem boundary when recursing.
                    925:                 * Replacing mount point directories is tricky. We need
                    926:                 * to sort out which directories to include.  As such,
                    927:                 * keep track of unique device inodes, and use these for
                    928:                 * comparison.
                    929:                 */
                    930:
                    931:                if (sess->opts->one_file_system &&
                    932:                    ent->fts_statp->st_dev != st.st_dev) {
                    933:                        if (sess->opts->one_file_system > 1 ||
                    934:                            !S_ISDIR(ent->fts_statp->st_mode))
                    935:                                continue;
                    936:
                    937:                        flag = 0;
                    938:                        for (i = 0; i < nxdev; i++)
                    939:                                if (xdev[i] == ent->fts_statp->st_dev) {
                    940:                                        flag = 1;
                    941:                                        break;
                    942:                                }
                    943:                        if (flag)
                    944:                                continue;
                    945:
1.28      benno     946:                        if ((newxdev = reallocarray(xdev, nxdev + 1,
                    947:                            sizeof(dev_t))) == NULL) {
                    948:                                ERRX1("reallocarray");
                    949:                                goto out;
                    950:                        }
                    951:                        xdev = newxdev;
1.24      bket      952:                        xdev[nxdev] = ent->fts_statp->st_dev;
                    953:                        nxdev++;
                    954:                }
                    955:
1.33      claudio   956:                /* filter files */
                    957:                if (rules_match(ent->fts_path + stripdir,
                    958:                    (ent->fts_info == FTS_D)) == -1) {
                    959:                        WARNX("%s: skipping excluded file",
                    960:                            ent->fts_path + stripdir);
                    961:                        fts_set(fts, ent, FTS_SKIP);
                    962:                        continue;
                    963:                }
                    964:
1.1       benno     965:                /* Allocate a new file entry. */
                    966:
1.26      benno     967:                if (!flist_realloc(fl, sz, max)) {
1.25      benno     968:                        ERRX1("flist_realloc");
1.1       benno     969:                        goto out;
                    970:                }
                    971:                flsz++;
                    972:                f = &(*fl)[*sz - 1];
                    973:
                    974:                /* Our path defaults to "." for the root. */
                    975:
1.20      deraadt   976:                if (ent->fts_path[stripdir] == '\0') {
1.29      deraadt   977:                        if (asprintf(&f->path, "%s.", ent->fts_path) == -1) {
1.25      benno     978:                                ERR("asprintf");
1.1       benno     979:                                f->path = NULL;
                    980:                                goto out;
                    981:                        }
                    982:                } else {
1.5       deraadt   983:                        if ((f->path = strdup(ent->fts_path)) == NULL) {
1.25      benno     984:                                ERR("strdup");
1.1       benno     985:                                goto out;
                    986:                        }
                    987:                }
                    988:
                    989:                f->wpath = f->path + stripdir;
                    990:                flist_copy_stat(f, ent->fts_statp);
                    991:
                    992:                /* Optionally copy link information. */
                    993:
                    994:                if (S_ISLNK(ent->fts_statp->st_mode)) {
1.34.2.1! benno     995:                        f->link = symlink_read(ent->fts_accpath);
1.5       deraadt   996:                        if (f->link == NULL) {
1.25      benno     997:                                ERRX1("symlink_read");
1.1       benno     998:                                goto out;
                    999:                        }
                   1000:                }
                   1001:
                   1002:                /* Reset errno for next fts_read() call. */
                   1003:                errno = 0;
                   1004:        }
                   1005:        if (errno) {
1.25      benno    1006:                ERR("fts_read");
1.1       benno    1007:                goto out;
1.10      benno    1008:        }
1.1       benno    1009:
1.25      benno    1010:        LOG3("generated %zu filenames: %s", flsz, root);
1.1       benno    1011:        rc = 1;
                   1012: out:
                   1013:        fts_close(fts);
1.28      benno    1014:        free(xdev);
1.1       benno    1015:        return rc;
                   1016: }
                   1017:
                   1018: /*
                   1019:  * Generate a flist recursively given the array of directories (or
                   1020:  * files, symlinks, doesn't matter) specified in argv (argc >0).
                   1021:  * On success, stores the generated list in "flp" with length "sz",
                   1022:  * which may be zero.
                   1023:  * Returns zero on failure, non-zero on success.
                   1024:  */
                   1025: static int
1.3       benno    1026: flist_gen_dirs(struct sess *sess, size_t argc, char **argv, struct flist **flp,
                   1027:     size_t *sz)
1.1       benno    1028: {
                   1029:        size_t           i, max = 0;
                   1030:
                   1031:        for (i = 0; i < argc; i++)
1.4       deraadt  1032:                if (!flist_gen_dirent(sess, argv[i], flp, sz, &max))
1.1       benno    1033:                        break;
                   1034:
                   1035:        if (i == argc) {
1.25      benno    1036:                LOG2("recursively generated %zu filenames", *sz);
1.1       benno    1037:                return 1;
                   1038:        }
                   1039:
1.25      benno    1040:        ERRX1("flist_gen_dirent");
1.1       benno    1041:        flist_free(*flp, max);
                   1042:        *flp = NULL;
                   1043:        *sz = 0;
                   1044:        return 0;
                   1045: }
                   1046:
                   1047: /*
                   1048:  * Generate list of files from the command-line argc (>0) and argv.
                   1049:  * On success, stores the generated list in "flp" with length "sz",
                   1050:  * which may be zero.
                   1051:  * Returns zero on failure, non-zero on success.
                   1052:  */
                   1053: static int
1.3       benno    1054: flist_gen_files(struct sess *sess, size_t argc, char **argv,
                   1055:     struct flist **flp, size_t *sz)
1.1       benno    1056: {
                   1057:        struct flist    *fl = NULL, *f;
                   1058:        size_t           i, flsz = 0;
                   1059:        struct stat      st;
                   1060:
                   1061:        assert(argc);
                   1062:
1.5       deraadt  1063:        if ((fl = calloc(argc, sizeof(struct flist))) == NULL) {
1.25      benno    1064:                ERR("calloc");
1.1       benno    1065:                return 0;
                   1066:        }
                   1067:
                   1068:        for (i = 0; i < argc; i++) {
1.20      deraadt  1069:                if (argv[i][0] == '\0')
1.1       benno    1070:                        continue;
1.5       deraadt  1071:                if (lstat(argv[i], &st) == -1) {
1.25      benno    1072:                        ERR("%s: lstat", argv[i]);
1.1       benno    1073:                        goto out;
                   1074:                }
                   1075:
                   1076:                /*
                   1077:                 * File type checks.
                   1078:                 * In non-recursive mode, we don't accept directories.
                   1079:                 * We also skip symbolic links without -l.
                   1080:                 * Beyond that, we only accept regular files.
                   1081:                 */
                   1082:
                   1083:                if (S_ISDIR(st.st_mode)) {
1.25      benno    1084:                        WARNX("%s: skipping directory", argv[i]);
1.1       benno    1085:                        continue;
                   1086:                } else if (S_ISLNK(st.st_mode)) {
1.4       deraadt  1087:                        if (!sess->opts->preserve_links) {
1.25      benno    1088:                                WARNX("%s: skipping symlink", argv[i]);
1.1       benno    1089:                                continue;
                   1090:                        }
1.4       deraadt  1091:                } else if (!S_ISREG(st.st_mode)) {
1.25      benno    1092:                        WARNX("%s: skipping special", argv[i]);
1.1       benno    1093:                        continue;
                   1094:                }
                   1095:
1.33      claudio  1096:                /* filter files */
                   1097:                if (rules_match(argv[i], S_ISDIR(st.st_mode)) == -1) {
                   1098:                        WARNX("%s: skipping excluded file", argv[i]);
                   1099:                        continue;
                   1100:                }
1.3       benno    1101:
1.1       benno    1102:                f = &fl[flsz++];
1.5       deraadt  1103:                assert(f != NULL);
1.1       benno    1104:
                   1105:                /* Add this file to our file-system worldview. */
                   1106:
1.26      benno    1107:                if (!flist_append(f, &st, argv[i])) {
1.25      benno    1108:                        ERRX1("flist_append");
1.1       benno    1109:                        goto out;
                   1110:                }
                   1111:        }
                   1112:
1.25      benno    1113:        LOG2("non-recursively generated %zu filenames", flsz);
1.1       benno    1114:        *sz = flsz;
                   1115:        *flp = fl;
                   1116:        return 1;
                   1117: out:
                   1118:        flist_free(fl, argc);
                   1119:        *sz = 0;
                   1120:        *flp = NULL;
                   1121:        return 0;
                   1122: }
                   1123:
                   1124: /*
                   1125:  * Generate a sorted, de-duplicated list of file metadata.
                   1126:  * In non-recursive mode (the default), we use only the files we're
                   1127:  * given.
                   1128:  * Otherwise, directories are recursively examined.
                   1129:  * Returns zero on failure, non-zero on success.
                   1130:  * On success, "fl" will need to be freed with flist_free().
                   1131:  */
                   1132: int
1.3       benno    1133: flist_gen(struct sess *sess, size_t argc, char **argv, struct flist **flp,
                   1134:     size_t *sz)
1.1       benno    1135: {
                   1136:        int      rc;
                   1137:
                   1138:        assert(argc > 0);
                   1139:        rc = sess->opts->recursive ?
                   1140:                flist_gen_dirs(sess, argc, argv, flp, sz) :
                   1141:                flist_gen_files(sess, argc, argv, flp, sz);
                   1142:
                   1143:        /* After scanning, lock our file-system view. */
                   1144:
1.10      benno    1145:        if (!rc)
1.1       benno    1146:                return 0;
                   1147:
                   1148:        qsort(*flp, *sz, sizeof(struct flist), flist_cmp);
                   1149:
1.26      benno    1150:        if (flist_dedupe(flp, sz)) {
1.1       benno    1151:                flist_topdirs(sess, *flp, *sz);
                   1152:                return 1;
                   1153:        }
                   1154:
1.25      benno    1155:        ERRX1("flist_dedupe");
1.1       benno    1156:        flist_free(*flp, *sz);
                   1157:        *flp = NULL;
                   1158:        *sz = 0;
                   1159:        return 0;
                   1160: }
                   1161:
                   1162: /*
                   1163:  * Generate a list of files in root to delete that are within the
                   1164:  * top-level directories stipulated by "wfl".
                   1165:  * Only handles symbolic links, directories, and regular files.
                   1166:  * Returns zero on failure (fl and flsz will be NULL and zero), non-zero
                   1167:  * on success.
                   1168:  * On success, "fl" will need to be freed with flist_free().
                   1169:  */
                   1170: int
1.3       benno    1171: flist_gen_dels(struct sess *sess, const char *root, struct flist **fl,
                   1172:     size_t *sz,        const struct flist *wfl, size_t wflsz)
1.1       benno    1173: {
                   1174:        char            **cargv = NULL;
1.24      bket     1175:        int               rc = 0, c, flag;
1.1       benno    1176:        FTS              *fts = NULL;
                   1177:        FTSENT           *ent;
                   1178:        struct flist     *f;
1.24      bket     1179:        struct stat       st;
1.1       benno    1180:        size_t            cargvs = 0, i, j, max = 0, stripdir;
                   1181:        ENTRY             hent;
                   1182:        ENTRY            *hentp;
1.2       benno    1183:
1.1       benno    1184:        *fl = NULL;
                   1185:        *sz = 0;
                   1186:
                   1187:        /* Only run this code when we're recursive. */
                   1188:
1.4       deraadt  1189:        if (!sess->opts->recursive)
1.1       benno    1190:                return 1;
                   1191:
1.2       benno    1192:        /*
1.1       benno    1193:         * Gather up all top-level directories for scanning.
                   1194:         * This is stipulated by rsync's --delete behaviour, where we
                   1195:         * only delete things in the top-level directories given on the
                   1196:         * command line.
                   1197:         */
                   1198:
                   1199:        assert(wflsz > 0);
                   1200:        for (i = 0; i < wflsz; i++)
                   1201:                if (FLSTAT_TOP_DIR & wfl[i].st.flags)
                   1202:                        cargvs++;
1.5       deraadt  1203:        if (cargvs == 0)
1.1       benno    1204:                return 1;
                   1205:
1.5       deraadt  1206:        if ((cargv = calloc(cargvs + 1, sizeof(char *))) == NULL) {
1.25      benno    1207:                ERR("calloc");
1.1       benno    1208:                return 0;
                   1209:        }
                   1210:
                   1211:        /*
                   1212:         * If we're given just a "." as the first entry, that means
                   1213:         * we're doing a relative copy with a trailing slash.
                   1214:         * Special-case this just for the sake of simplicity.
                   1215:         * Otherwise, look through all top-levels.
                   1216:         */
                   1217:
1.5       deraadt  1218:        if (wflsz && strcmp(wfl[0].wpath, ".") == 0) {
                   1219:                assert(cargvs == 1);
1.1       benno    1220:                assert(S_ISDIR(wfl[0].st.mode));
1.29      deraadt  1221:                if (asprintf(&cargv[0], "%s/", root) == -1) {
1.25      benno    1222:                        ERR("asprintf");
1.1       benno    1223:                        cargv[0] = NULL;
                   1224:                        goto out;
                   1225:                }
                   1226:                cargv[1] = NULL;
                   1227:        } else {
                   1228:                for (i = j = 0; i < wflsz; i++) {
1.4       deraadt  1229:                        if (!(FLSTAT_TOP_DIR & wfl[i].st.flags))
1.1       benno    1230:                                continue;
                   1231:                        assert(S_ISDIR(wfl[i].st.mode));
                   1232:                        assert(strcmp(wfl[i].wpath, "."));
1.5       deraadt  1233:                        c = asprintf(&cargv[j], "%s/%s", root, wfl[i].wpath);
1.29      deraadt  1234:                        if (c == -1) {
1.25      benno    1235:                                ERR("asprintf");
1.1       benno    1236:                                cargv[j] = NULL;
                   1237:                                goto out;
                   1238:                        }
1.25      benno    1239:                        LOG4("%s: will scan for deletions", cargv[j]);
1.1       benno    1240:                        j++;
                   1241:                }
                   1242:                assert(j == cargvs);
                   1243:                cargv[j] = NULL;
                   1244:        }
                   1245:
1.25      benno    1246:        LOG2("delete from %zu directories", cargvs);
1.1       benno    1247:
                   1248:        /*
                   1249:         * Next, use the standard hcreate(3) hashtable interface to hash
                   1250:         * all of the files that we want to synchronise.
                   1251:         * This way, we'll be able to determine which files we want to
                   1252:         * delete in O(n) time instead of O(n * search) time.
                   1253:         * Plus, we can do the scan in-band and only allocate the files
                   1254:         * we want to delete.
                   1255:         */
                   1256:
1.4       deraadt  1257:        if (!hcreate(wflsz)) {
1.25      benno    1258:                ERR("hcreate");
1.1       benno    1259:                goto out;
                   1260:        }
                   1261:
                   1262:        for (i = 0; i < wflsz; i++) {
                   1263:                memset(&hent, 0, sizeof(ENTRY));
1.5       deraadt  1264:                if ((hent.key = strdup(wfl[i].wpath)) == NULL) {
1.25      benno    1265:                        ERR("strdup");
1.1       benno    1266:                        goto out;
                   1267:                }
1.5       deraadt  1268:                if ((hentp = hsearch(hent, ENTER)) == NULL) {
1.25      benno    1269:                        ERR("hsearch");
1.1       benno    1270:                        goto out;
                   1271:                } else if (hentp->key != hent.key) {
1.25      benno    1272:                        ERRX("%s: duplicate", wfl[i].wpath);
1.1       benno    1273:                        free(hent.key);
                   1274:                        goto out;
                   1275:                }
                   1276:        }
                   1277:
1.2       benno    1278:        /*
1.1       benno    1279:         * Now we're going to try to descend into all of the top-level
                   1280:         * directories stipulated by the file list.
                   1281:         * If the directories don't exist, it's ok.
                   1282:         */
                   1283:
1.5       deraadt  1284:        if ((fts = fts_open(cargv, FTS_PHYSICAL, NULL)) == NULL) {
1.25      benno    1285:                ERR("fts_open");
1.1       benno    1286:                goto out;
                   1287:        }
                   1288:
                   1289:        stripdir = strlen(root) + 1;
                   1290:        errno = 0;
1.5       deraadt  1291:        while ((ent = fts_read(fts)) != NULL) {
                   1292:                if (ent->fts_info == FTS_NS)
1.1       benno    1293:                        continue;
1.4       deraadt  1294:                if (!flist_fts_check(sess, ent)) {
1.1       benno    1295:                        errno = 0;
                   1296:                        continue;
                   1297:                } else if (stripdir >= ent->fts_pathlen)
                   1298:                        continue;
                   1299:
1.24      bket     1300:                assert(ent->fts_statp != NULL);
                   1301:
                   1302:                /*
                   1303:                 * If rsync is told to avoid crossing a filesystem
                   1304:                 * boundary when recursing, then exclude all entries
                   1305:                 * from the list with a device inode, which does not
                   1306:                 * match that of one of the top-level directories.
                   1307:                 */
                   1308:
                   1309:                if (sess->opts->one_file_system) {
                   1310:                        flag = 0;
                   1311:                        for (i = 0; i < wflsz; i++) {
                   1312:                                if (stat(wfl[i].path, &st) == -1) {
1.25      benno    1313:                                        ERR("%s: stat", wfl[i].path);
1.24      bket     1314:                                        goto out;
                   1315:                                }
                   1316:                                if (ent->fts_statp->st_dev == st.st_dev) {
                   1317:                                        flag = 1;
                   1318:                                        break;
                   1319:                                }
                   1320:                        }
                   1321:                        if (!flag)
                   1322:                                continue;
1.33      claudio  1323:                }
                   1324:
                   1325:                /* filter files on delete */
                   1326:                /* TODO handle --delete-excluded */
                   1327:                if (rules_match(ent->fts_path + stripdir,
                   1328:                    (ent->fts_info == FTS_D)) == -1) {
                   1329:                        WARNX("skip excluded file %s",
                   1330:                            ent->fts_path + stripdir);
                   1331:                        fts_set(fts, ent, FTS_SKIP);
                   1332:                        continue;
1.24      bket     1333:                }
                   1334:
1.1       benno    1335:                /* Look up in hashtable. */
                   1336:
                   1337:                memset(&hent, 0, sizeof(ENTRY));
                   1338:                hent.key = ent->fts_path + stripdir;
1.5       deraadt  1339:                if (hsearch(hent, FIND) != NULL)
1.1       benno    1340:                        continue;
                   1341:
                   1342:                /* Not found: we'll delete it. */
                   1343:
1.26      benno    1344:                if (!flist_realloc(fl, sz, &max)) {
1.25      benno    1345:                        ERRX1("flist_realloc");
1.1       benno    1346:                        goto out;
                   1347:                }
                   1348:                f = &(*fl)[*sz - 1];
                   1349:
1.5       deraadt  1350:                if ((f->path = strdup(ent->fts_path)) == NULL) {
1.25      benno    1351:                        ERR("strdup");
1.1       benno    1352:                        goto out;
                   1353:                }
                   1354:                f->wpath = f->path + stripdir;
                   1355:                flist_copy_stat(f, ent->fts_statp);
                   1356:                errno = 0;
                   1357:        }
                   1358:
                   1359:        if (errno) {
1.25      benno    1360:                ERR("fts_read");
1.1       benno    1361:                goto out;
                   1362:        }
                   1363:
                   1364:        qsort(*fl, *sz, sizeof(struct flist), flist_cmp);
                   1365:        rc = 1;
                   1366: out:
1.5       deraadt  1367:        if (fts != NULL)
1.1       benno    1368:                fts_close(fts);
                   1369:        for (i = 0; i < cargvs; i++)
                   1370:                free(cargv[i]);
                   1371:        free(cargv);
                   1372:        hdestroy();
                   1373:        return rc;
                   1374: }
                   1375:
                   1376: /*
                   1377:  * Delete all files and directories in "fl".
                   1378:  * If called with a zero-length "fl", does nothing.
                   1379:  * If dry_run is specified, simply write what would be done.
                   1380:  * Return zero on failure, non-zero on success.
                   1381:  */
                   1382: int
1.3       benno    1383: flist_del(struct sess *sess, int root, const struct flist *fl, size_t flsz)
1.1       benno    1384: {
                   1385:        ssize_t  i;
                   1386:        int      flag;
                   1387:
1.5       deraadt  1388:        if (flsz == 0)
1.1       benno    1389:                return 1;
                   1390:
                   1391:        assert(sess->opts->del);
                   1392:        assert(sess->opts->recursive);
                   1393:
                   1394:        for (i = flsz - 1; i >= 0; i--) {
1.25      benno    1395:                LOG1("%s: deleting", fl[i].wpath);
1.1       benno    1396:                if (sess->opts->dry_run)
                   1397:                        continue;
1.5       deraadt  1398:                assert(root != -1);
1.1       benno    1399:                flag = S_ISDIR(fl[i].st.mode) ? AT_REMOVEDIR : 0;
1.5       deraadt  1400:                if (unlinkat(root, fl[i].wpath, flag) == -1 &&
                   1401:                    errno != ENOENT) {
1.25      benno    1402:                        ERR("%s: unlinkat", fl[i].wpath);
1.1       benno    1403:                        return 0;
                   1404:                }
                   1405:        }
                   1406:
                   1407:        return 1;
                   1408: }