V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
viaNull
V2EX  ›  问与答

百度知道的部分网页,部分文字用图片来代替了,可能是什么目的?

  •  
  •   viaNull · 2014-10-22 12:06:59 +08:00 · 7738 次点击
    这是一个创建于 3692 天前的主题,其中的信息可能已经有所发展或是发生改变。
    偶然发现,在百度知道答案区域,是由文字穿插着图片来的,是出于什么考虑呢?
    如: http://zhidao.baidu.com/link?url=yaSXy7MjKU05cCqZiiv0_pXJKexxGTK3IwIKcfWEdH8uoVS6Aiu4fvawu1i6l6gGkhArGDW_I9-GLcTSbUbVi_

    打开之后,看答案部分网页源码。
    第 1 条附言  ·  2014-10-22 13:12:40 +08:00
    append 一个图试试

    应该是我学校出口IP被认定为爬虫了吧,情况是这样的:
    http://dl-paper.qiniudn.com/123.png
    第 2 条附言  ·  2014-10-22 20:52:20 +08:00
    感觉 29L正解
    37 条回复    2014-10-23 09:12:18 +08:00
    Tonni
        1
    Tonni  
       2014-10-22 12:13:23 +08:00 via Android
    搜索也是,不知道出于什么目的
    akira
        2
    akira  
       2014-10-22 12:17:04 +08:00
    防拷贝?
    cxe2v
        3
    cxe2v  
       2014-10-22 12:19:04 +08:00
    我看到的仍旧是文字
    cjjia
        4
    cjjia  
       2014-10-22 12:21:56 +08:00
    @cxe2v 仔细看看,按ctrl+a 键
    viaNull
        5
    viaNull  
    OP
       2014-10-22 12:24:18 +08:00
    貌似是最近几天才弄的,之前还没发现
    heylogo
        6
    heylogo  
       2014-10-22 12:26:27 +08:00
    @viaNull 好久之前就这样了
    zzNucker
        7
    zzNucker  
       2014-10-22 12:26:36 +08:00
    我看到的都是文字
    cougar
        8
    cougar  
       2014-10-22 12:28:18 +08:00
    图片指的是哪个?类似问题那里的第一个吗?
    cst4you
        9
    cst4you  
       2014-10-22 12:28:30 +08:00
    我看到的都是文字
    iscraft
        10
    iscraft  
       2014-10-22 12:29:31 +08:00
    chromium 都是文字
    cevincheung
        11
    cevincheung  
       2014-10-22 12:34:16 +08:00
    看到的仍旧是文字
    xifangczy
        12
    xifangczy  
       2014-10-22 12:37:41 +08:00   ❤️ 1
    你说的是
    <img id="selectsearch-icon" alt="搜索" src="http://img.baidu.com/img/iknow/qb/select-search.png">
    这个么?这是划词搜索啊
    qiayue
        13
    qiayue  
       2014-10-22 12:38:23 +08:00
    防爬虫,防抓取
    nsxuan
        14
    nsxuan  
       2014-10-22 12:39:13 +08:00 via Android
    防采集,把你认为是爬虫了
    Perry
        15
    Perry  
       2014-10-22 12:42:27 +08:00   ❤️ 1
    @xifangczy 正解。。。
    lausius
        16
    lausius  
       2014-10-22 12:46:36 +08:00
    估计是防复制防抓取吧。其实我发现这个前几个月时间已经这样了,不过偶尔也会正常,像现在我这边打开就是正常显示文字的。
    viaNull
        17
    viaNull  
    OP
       2014-10-22 12:50:24 +08:00
    @xifangczy 看来我们的情况不一样,我这里有类似这样的:

    写入<img class="word-replace" src="http://zhidao.baidu.com/api/getdecpic?picenc=684764616f8b10">文件<img class="word-replace" src="http://zhidao.baidu.com/api/getdecpic?picenc=684773746f708b10"><img class="word-replace" src="http://zhidao.baidu.com/api/getdecpic?picenc=6847686f758b10">面跟着a.txt<img class="word-replace" src="http://zhidao.baidu.com/api/getdecpic?picenc=6847636f6d6d618b10"><img class="word-replace" src="http://zhidao.baidu.com/api/getdecpic?picenc=68476a69758b10">表示写入<img class="word-replace" src="http://zhidao.baidu.com/api/getdecpic?picenc=684764616f8b10">a.txt
    viaNull
        18
    viaNull  
    OP
       2014-10-22 12:50:43 +08:00
    @nsxuan 感觉是的
    pimin
        19
    pimin  
       2014-10-22 12:53:20 +08:00
    表示打开任然是文字
    mornlight
        20
    mornlight  
       2014-10-22 12:54:18 +08:00
    都是文字啊。我还把src=都看了一遍,没找到正文里有图片。
    url
        21
    url  
       2014-10-22 13:03:00 +08:00 via Android
    拷贝,采集
    aWangami
        22
    aWangami  
       2014-10-22 13:13:09 +08:00
    好像不是所有人都能看到图片,特定情况才会触发
    sloppysop
        23
    sloppysop  
       2014-10-22 14:17:24 +08:00
    仍旧是文字。
    Jreen
        24
    Jreen  
       2014-10-22 14:32:35 +08:00
    仍然是文字。
    rrfeng
        25
    rrfeng  
       2014-10-22 14:49:56 +08:00
    见过图片。应该是防爬虫采集答案吧。
    xiaoai
        26
    xiaoai  
       2014-10-22 14:51:13 +08:00
    登陆后为文字,图片是防止爬虫爬答案
    cst4you
        27
    cst4you  
       2014-10-22 15:05:49 +08:00
    图片真是愚蠢的做法, 一个换了字体的浏览器或者非windows, 就破功了.
    loserwn
        28
    loserwn  
       2014-10-22 15:36:57 +08:00
    估计po主被小流量了吧
    caomu
        29
    caomu  
       2014-10-22 15:45:10 +08:00
    sxliusir
        30
    sxliusir  
       2014-10-22 18:04:48 +08:00
    打开都是文字
    xiaolang
        31
    xiaolang  
       2014-10-22 18:15:54 +08:00
    仍然是文字。 暂未发现有图片的情况
    fr0m
        32
    fr0m  
       2014-10-22 18:42:53 +08:00
    都是文字,是灰度发布还是跟系统有关?
    Aegg
        33
    Aegg  
       2014-10-22 19:51:01 +08:00
    防爬虫
    fghdvbgt
        34
    fghdvbgt  
       2014-10-22 20:02:11 +08:00
    都是文字+1
    jacob
        35
    jacob  
       2014-10-22 21:05:32 +08:00
    是文字,不过划词搜索有时候让你以为图片,
    whywhywhy
        36
    whywhywhy  
       2014-10-23 08:39:55 +08:00
    好久以前就有了,有些文字会替换成图片(但是看起来差不多,不容易区分),防止爬虫吧。

    因为各大网站的问答这一块 都是互相采集的
    DRcoding
        37
    DRcoding  
       2014-10-23 09:12:18 +08:00
    连续F5刷新几遍后就会跳到 403 error页面,竟然是这种设定,Orz...
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2691 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 05:26 · PVG 13:26 · LAX 21:26 · JFK 00:26
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.