V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Distributions
Ubuntu
Fedora
CentOS
中文资源站
网易开源镜像站
drlittlemouse
V2EX  ›  Linux

请教关于 dd 命令问题

  •  
  •   drlittlemouse · 2015-10-12 04:28:50 +08:00 · 4032 次点击
    这是一个创建于 3308 天前的主题,其中的信息可能已经有所发展或是发生改变。

    最近在用 dd 命令当作 16 进制编辑器来组装文件

    用法类似于

    dd status=none if=/dev/zero bs=1048576 count=${size} | tr '\000' '\377' > ${tmpfile}

    先生成指定大小${size}的一个文件并用 0xFF 填充

    分别写入几个小文件

    dd status=none conv=notrunc if=${art} of=${tmpfile} seek=${artoffset} bs=1
    dd status=none conv=notrunc if=${uboot} of=${tmpfile} seek=0 bs=1
    dd status=none conv=notrunc if=${firmware} of=${tmpfile} seek=${ubootsize} bs=1

    (估计有人看出来了,其实就是用来做编程器镜像的:P )

    这个肯定是没问题的,但是在写入${firmware}的时候,会发现效率很低,因为 bs=1 嘛

    于是我尝试修改了一下 bs ,结果带来 2 个问题

    1 、因为一开始没意识到 seek 和 bs 的关系——按照 man 说明, seek 其实是 blocks ,也就是 seek * bs 才是最终 offset ,结果生成了一个超大的文件( 1.7TB ),这已经远远超出了我磁盘的空间,但是删除后没发现有什么文件被覆盖,为什么呢?是因为其实前面都被 seek 掉了么,其实写入的还是${firmware}流的大小?

    2 、既然 seek 和 bs 紧密相关,有没有提高 I/O 效率的方式呢?

    10 条回复    2015-10-12 07:41:56 +08:00
    ryd994
        1
    ryd994  
       2015-10-12 04:34:58 +08:00   ❤️ 1
    1.应该是 seek 超出大小又写入的话会自动 extend 文件
    2.提高效率就不要用 dd ,写个 python 脚本绝对比这个简单
    msg7086
        2
    msg7086  
       2015-10-12 04:47:20 +08:00   ❤️ 1
    正常情况下 seek 不占用空间的。

    $ truncate --size 15TiB a
    $ dd if=/dev/null of=b seek=15 bs=1TiB count=0
    $ ll
    总用量 0
    -rw-r--r-- 1 msg7086 msg7086 15T 10 月 11 16:47 a
    -rw-r--r-- 1 msg7086 msg7086 15T 10 月 11 16:47 b
    msg7086
        3
    msg7086  
       2015-10-12 04:49:25 +08:00   ❤️ 1
    seek 并非和 bs 相关。
    Let me google it for you: http://www.gnu.org/software/coreutils/manual/html_node/dd-invocation.html

    ‘ seek=n ’

    Skip n ‘ obs ’-byte blocks in the output file before copying.

    if ‘ oflag=seek_bytes ’ is specified, n is interpreted as a byte count rather than a block count.
    drlittlemouse
        4
    drlittlemouse  
    OP
       2015-10-12 04:50:15 +08:00
    @ryd994
    1.应该是 seek 超出大小又写入的话会自动 extend 文件
    请问是否有这样的资料可以参考?对您提到的这个 extend 机制。

    2.提高效率就不要用 dd ,写个 python 脚本绝对比这个简单
    因为一些原因无法安装 python ,所以仅限在 bash 下解决,目前我能想到的变通的方法是,单独生成填充块,然后用 cat 拼接,但是感觉这样做好 low 的。
    drlittlemouse
        5
    drlittlemouse  
    OP
       2015-10-12 04:51:03 +08:00
    @msg7086 谢谢!解释了我第一个问题的。
    drlittlemouse
        6
    drlittlemouse  
    OP
       2015-10-12 04:56:54 +08:00
    @msg7086

    是的, Skip n ‘ obs ’-byte blocks in the output file before copying.

    但是当定义 bs 的时候会覆盖 obs 和 ibs

    不过您提到的
    oflag=seek_bytes

    是否对 dd 版本有要求?

    dd (coreutils) 8.4
    Copyright (C) 2010 Free Software Foundation, Inc.
    License GPLv3+: GNU GPL version 3 or later <http://gnu.org/licenses/gpl.html>.
    This is free software: you are free to change and redistribute it.
    There is NO WARRANTY, to the extent permitted by law.

    Written by Paul Rubin, David MacKenzie, and Stuart Kemp.

    报错
    dd: invalid output flag: `seek_bytes'
    ryd994
        7
    ryd994  
       2015-10-12 05:06:15 +08:00 via Android
    @drlittlemouse
    1.http://linux.die.net/man/2/lseek
    2.tr '\000' '\377' </dev/zero | dd of=out 这样应该就可以指定合适的块大小而不是 1 了
    drlittlemouse
        8
    drlittlemouse  
    OP
       2015-10-12 05:12:09 +08:00
    @ryd994

    2.tr '\000' '\377' </dev/zero | dd of=out 这样应该就可以指定合适的块大小而不是 1 了

    生成 0xFF 文件没有问题,现在是 MB 生成的

    问题在于后面写入镜像碎片的时候
    drlittlemouse
        9
    drlittlemouse  
    OP
       2015-10-12 05:41:17 +08:00
    @msg7086

    编译到
    dd (coreutils) 8.24
    Copyright (C) 2015 Free Software Foundation, Inc.
    License GPLv3+: GNU GPL version 3 or later <http://gnu.org/licenses/gpl.html>.
    This is free software: you are free to change and redistribute it.
    There is NO WARRANTY, to the extent permitted by law.

    Written by Paul Rubin, David MacKenzie, and Stuart Kemp.

    可以使用 'seek_bytes' 参数,多谢!

    问题已经解决。
    introom
        10
    introom  
       2015-10-12 07:41:56 +08:00 via Android
    这个东西叫做 file hole, 大部分文件系统都支持。主要用处是 sparse file, 比如 vm 镜像。可以看 man 2 lseek 还是 man 2 seek, 手机码字不去确认了
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1941 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 16:22 · PVG 00:22 · LAX 09:22 · JFK 12:22
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.