V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
pinterest
V2EX  ›  分享发现

“纸”这个字的编码有什么特殊的地方吗?

  •  1
     
  •   pinterest · 2016-07-31 12:34:13 +08:00 · 3117 次点击
    这是一个创建于 3045 天前的主题,其中的信息可能已经有所发展或是发生改变。

    和等号一起化为一个点,非常奇怪

    譬如:
    https://www.baidu.com/s?wd=ֽ

    21 条回复    2016-08-03 03:03:54 +08:00
    viko16
        1
    viko16  
       2016-07-31 12:47:12 +08:00   ❤️ 3
    查了一下,这个点似乎是希伯来语?
    http://graphemica.com/05BD
    vibbow
        2
    vibbow  
       2016-07-31 12:48:29 +08:00
    pinterest
        3
    pinterest  
    OP
       2016-07-31 12:48:42 +08:00
    @viko16 网站不错,收下了
    Lonely
        4
    Lonely  
       2016-07-31 12:53:15 +08:00   ❤️ 1
    是我网有问题还是楼上两位的头像都是空白😒
    pinterest
        5
    pinterest  
    OP
       2016-07-31 12:56:21 +08:00
    @Lonely 巧合,哈哈
    imn1
        6
    imn1  
       2016-07-31 13:01:21 +08:00
    @Lonely
    再来一发
    Lonely
        7
    Lonely  
       2016-07-31 13:06:56 +08:00
    @imn1 🙄
    RqPS6rhmP3Nyn3Tm
        8
    RqPS6rhmP3Nyn3Tm  
       2016-07-31 13:21:24 +08:00
    >>> ord('纸')
    32440
    pinterest
        9
    pinterest  
    OP
       2016-07-31 13:28:09 +08:00
    @BXIA
    那个希伯来语文字`ֽ`
    =`=`
    纸`纸`

    有什么联系呢?
    lizheming
        10
    lizheming  
       2016-07-31 14:37:05 +08:00   ❤️ 2
    因为点的 url 编码是 %D6%BD ,然后百度是使用 GBK 编码的,纸的 GBK 正好是 D6BD
    pinterest
        11
    pinterest  
    OP
       2016-07-31 15:08:15 +08:00   ❤️ 2
    @lizheming 正解!!终于解惑了
    另外: D6BD 毒瘤百度,哈哈啊哈哈(手动滑稽)
    strwei
        12
    strwei  
       2016-07-31 15:30:45 +08:00
    @viko16 网站不错,收下了
    strwei
        13
    strwei  
       2016-07-31 15:31:06 +08:00
    @viko16 网站不错,收下了
    SmiteChow
        14
    SmiteChow  
       2016-07-31 15:51:12 +08:00
    @lizheming 厉害
    lizheming
        15
    lizheming  
       2016-07-31 16:14:22 +08:00   ❤️ 1
    @pinterest 百度和淘宝这种大站为了节省流量使用 GBK 编码很久了~( UTF-8 的中文是 2-4 个字节的,而 GBK 2 个字节就能表示中文了 =w=)
    kanezeng
        16
    kanezeng  
       2016-07-31 16:16:21 +08:00
    @lizheming UTF-8 的中文至少 3 个字节吧
    lizheming
        17
    lizheming  
       2016-07-31 16:21:46 +08:00
    @kanezeng 嗯,是的,有点尴尬,你就看成左开右闭区吧(逃....哈哈哈哈
    RqPS6rhmP3Nyn3Tm
        18
    RqPS6rhmP3Nyn3Tm  
       2016-08-01 01:46:22 +08:00 via Android
    就和当年琨斤拷一样啊,还有烫烫烫
    BlueMeow
        19
    BlueMeow  
       2016-08-02 15:40:52 +08:00
    @lizheming GBK 也有历史问题吧,当年百度一直是 GBK 的,也够用,就不改了。
    lizheming
        20
    lizheming  
       2016-08-02 19:17:15 +08:00
    @BlueMeow 历史问题的占比非常小,因为内部的开发肯定全都是 UTF-8 的,为何要特地保留下 GBK 这才是更大的因素。
    zonghua
        21
    zonghua  
       2016-08-03 03:03:54 +08:00
    好有趣
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2594 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 06:27 · PVG 14:27 · LAX 22:27 · JFK 01:27
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.