V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  binux  ›  全部回复第 236 页 / 共 338 页
回复总数  6756
1 ... 232  233  234  235  236  237  238  239  240  241 ... 338  
2015-01-19 22:10:48 +08:00
回复了 caizixian 创建的主题 Python Scrapy 的结果如何处理?
1、放内存
2、放数据库
3、放elasticsearch
2015-01-18 21:53:02 +08:00
回复了 Livid 创建的主题 Hadoop 命令行工具用好了,在一定数据量下,不一定比 Hadoop 慢
1.75G,12秒。。。别闹
2015-01-18 12:02:42 +08:00
回复了 Kilerd 创建的主题 Python Python Web 框架的选择
如果你喜欢搞一点小的,富交互的,websocket,进程内通信什么的,tornado 异步+单进程方便很多。有消息放内存变量就好了。
@kisshere 比如 cp 到 /usr/local/bin,一般会有一个脚本,或者参数干这个
install 了吗?
2015-01-16 22:21:20 +08:00
回复了 hester 创建的主题 2015 15 年你想获取的新技能是什么?
英语
2015-01-16 18:38:01 +08:00
回复了 ykshen 创建的主题 分享发现 推荐个网页抓取神器 kimonolabs.com
2015-01-16 16:29:57 +08:00
回复了 yanwen 创建的主题 macOS finder 出现的上下滑动条如何取消?
把鼠标拔掉
2015-01-15 21:01:27 +08:00
回复了 Anybfans 创建的主题 问与答 请教一个关于 Pythin 2.7 中文乱码的问题。
什么是编码
-------------

对于计算机来说,它认识的就是01,称为 1bit,然后我们一般将 8bit 称为 1byte。那么这 1byte 能表示多少个字符呢? 2^8 = 256 种。那么问题来了,对于中文来说,上万个字,怎么表示得完啊。
于是,就有了用多个 bytes 表示一个字的方法,这个表示方法就叫做编码。

而编码有各种不同的标准,比如 gb2312 比如 gb18030 比如 utf8。当你看到一个二进制串的时候,你的告诉我,它是什么编码的,别人才能理解。所以单独给出一个二进制串,它是什么编码的,是没有办法知道的,只能猜。
因为很重要,再说一遍,**一个二进制串是什么编码的,只能猜**,通过组合多个 bytes 看他是否在某个编码下合法,组合出来的字是否常见,猜!所以对于短文本,这是很不准的。甚至有一个二进制传,同时在 utf8 和 gb2312 下都是合法,合理的文字。

所以,回到你这个问题,一般来说 gb2312 是 2bytes 的,而且几乎所有的 2bytes 都能转换成 gb2312,所以,当它是一个字的时候,chardet 不会猜它是 gb2312,但是两个字的时候就有可能会。


什么是 unicode
-------------
这一堆编码有两个问题:

1. 世界上有很多语言,有更多种编码
2. gb2312 只有两字节,表示不完所有语言文字,而 utf8 是不定长的,你没法通过数二进制串知道它有几个字。

为了解决这两个问题,unicode 出现了,unicode 设计能够在编码空间内(不准确),容纳所有语言的所有字符。并且它是定长的(不准确)。所以,在 Python 中,我们提倡所有文字都使用 unicode。

但是,回到计算机体系中,计算机只认识 01,你是不能将一个 unicode 传递给别的系统的(不准确)。他们之间的传递,必须是二进制串。在这时,你必须将 unicode encode 为一个特定编码,而且这个编码是和对方系统约定好的。不然就会出现乱码,或者异常。这个过程发生在,例如:

- print 输出
- 将文字保存到文件
- 储存数据库
- 网络发包
- 调用 shell 程序

等等。

**因为很重要再说一遍,你必须和对方系统约定正确的编码**。二进制串不指定编码,别人是无法理解的。
2015-01-15 14:05:27 +08:00
回复了 fdsfsdfsdf3334 创建的主题 随想 我觉得用 py2 的人,就是不愿意剪辫子的人
@est 我用的所有库都封装了,下载量排名前 200 的,还有哪个依赖 MySQLdb 的?现在 py3 的生态环境已经很好了,https://python3wos.appspot.com/ 不支持的库,大部分都有替代,或者它是 app 不是 framework。
@simomo2010 没有封装数据库操作层的项目,劝你别用了。
2015-01-15 13:17:20 +08:00
回复了 fdsfsdfsdf3334 创建的主题 随想 我觉得用 py2 的人,就是不愿意剪辫子的人
@est 如果你连数据库层都没有封装,还是别来讨论这个问题了。
2015-01-15 11:19:34 +08:00
回复了 lanyimo 创建的主题 Python Python 新手,找司机带路(求师)
@1989922yan
python 3 的第三方依赖已经基本解决了,排名高的,能用到的库都已经支持 python 3 了。那些不支持的,都是有替代项目,然后老的不维护了而已。
2015-01-15 09:42:30 +08:00
回复了 fdsfsdfsdf3334 创建的主题 随想 我觉得用 py2 的人,就是不愿意剪辫子的人
@est 用 mysql-connector-python 啊!!!!!
2015-01-14 14:38:15 +08:00
回复了 liyu 创建的主题 求职 做了个 html 简历,大家给点意见嘛
语义化
2015-01-14 12:50:31 +08:00
回复了 belm 创建的主题 Docker docker 的实际应用案例
demo.pyspider.org 就是用 docker 部署的
2015-01-13 14:37:01 +08:00
回复了 slove 创建的主题 硬件 小米电视 2 和 letv 电视应该选那样?有用过的说下优缺点啊?
小米电视一些 APP 无法用遥控器操作,可以手机投影遥控。
但是,但是,我的小米电视估计是重力方向错乱,手机遥控的时候,操控坐标和实际坐标旋转了90度。
现在根本没人管。。。
当前窗口打开是给深度优先浏览方式的用户用的
在新窗口打开是给广度优先浏览方式的用户用的

可惜我是广度优先
2015-01-12 11:42:52 +08:00
回复了 acwind 创建的主题 macOS OSX 双屏变单屏后,原来在另一个屏幕里的程序不回到主屏上……
缩放
2015-01-12 11:09:21 +08:00
回复了 geeglo 创建的主题 问与答 易名中国如何转出?不上传身份证照片。
@geeglo 那注册的时候要不要给你来一个选项:简易转出模式,安全转出模式 啊
1 ... 232  233  234  235  236  237  238  239  240  241 ... 338  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3841 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 84ms · UTC 05:26 · PVG 13:26 · LAX 22:26 · JFK 01:26
Developed with CodeLauncher
♥ Do have faith in what you're doing.