V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
omg21
V2EX  ›  Python

字典的 value 中有引号怎么处理?

  •  
  •   omg21 · 2017-01-16 22:14:57 +08:00 · 4290 次点击
    这是一个创建于 2873 天前的主题,其中的信息可能已经有所发展或是发生改变。
    {"NAME":"哈尔滨双城区"互联网+农业"高标准示范基地活动周开幕"}

    这是用 requests post 爬下来的内容,一直都好好的,但是突然 这次出了故障,检查之后发现故障出在这里, value 中的字符串中有双引号,拿到的数据就是这样,怎么好改?请问这应该怎么处理?
    9 条回复    2017-01-19 15:30:18 +08:00
    tianice
        1
    tianice  
       2017-01-16 22:40:59 +08:00
    检查一下自己的程序有问题还是爬取得数据有问题,如果是爬取得数据有问题就比较麻烦了,可能需要自己写 json 解析,简单的好说,复杂的就不好写了, value 中如果再有冒号就麻烦了, key 和 value 都分不出来了
    omg21
        2
    omg21  
    OP
       2017-01-16 23:08:00 +08:00
    @tianice 不是程序的问题,这是爬下来的数据,其他字符串都排除了问题,问题就出在这个标题的引号上,
    just1
        3
    just1  
       2017-01-16 23:14:25 +08:00 via Android
    \"
    xpresslink
        4
    xpresslink  
       2017-01-17 00:02:42 +08:00
    这个还不简单,用三引号包起来,或单引号外层。 repr()
    SoloCompany
        5
    SoloCompany  
       2017-01-17 00:09:09 +08:00
    明显是你自己的爬虫程序写的有问题
    Arthur2e5
        6
    Arthur2e5  
       2017-01-17 05:15:45 +08:00
    如果输入就坏了的话,那就直接上正则硬解好了……
    omg21
        7
    omg21  
    OP
       2017-01-17 09:25:55 +08:00
    @SoloCompany
    拿到的字符串就是这样的
    {"NAME":"哈尔滨双城区"互联网+农业"高标准示范基地活动周开幕"}
    正确的写法就不会拿到这样的数据,对吗?
    zonyitoo
        8
    zonyitoo  
       2017-01-17 15:45:12 +08:00
    这个根本不是合法的 Json ,也不是 Python 。程序写得有问题,直接拼字符串拼出问题了
    omg21
        9
    omg21  
    OP
       2017-01-19 15:30:18 +08:00
    @zonyitoo 谢谢,已经搞定了
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3405 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 00:43 · PVG 08:43 · LAX 16:43 · JFK 19:43
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.