玛莉蓓尔的花房

认为有些人的故事不改成评书太可惜了,写博客说书图一乐。
《银英》莱因哈特;
《游戏王》暗游戏/亚图姆;
是这俩人的厨,但是不毒唯。
还有许多喜欢的作品和本命人物,指环王,哈利波特,柯南,安室透,福尔摩斯,各种儿童文学,等等的。
喜欢有缺点但有趣且有生命力的角色。
欢迎一起搞笑。

windows64位安装Python3.6、numpy、matplotlib、sklearn

前天在知乎看到一位大神写的帖子:用Python分析《红楼梦》,我实在想试试,但是之前虽然也学过Python,用得却不怎么熟,也放下了许久,还是用Java去了,借这个机会重新捡起来。

原作者的代码是用Python3写的,所以我安装的比较新版的Python3.6,操作系统Windows7(64位),需要的全部安装文件我放在自己的度娘网盘一份:https://pan.baidu.com/s/1i4LmNul 密码:hhvx

它们长这样:

也可以在相应软件的官网下载。需要说明的是,numpy-1.12.1-cp36-none-win_amd64.whl这个文件原本叫numpy‑1.12.1+mkl‑cp36‑cp36m‑win_amd64.whl,但是安装的时候会报错,所以我按照python3.6安装numpy scipy matplotlib的正确打开方式(win64) 这个帖子的作者所说,改了它的名字,另外这位作者也分享了除sklearn之外所有的资源,我之前还各种找,要是早早找到他的帖子就好啦。


1、安装python3.6

安装文件是个exe,双击执行就好,要勾选Add Python3.6 to Path

PS:其实这就可以运行知乎那位大神写的程序的大部分内容了,比如这样:


Python代码源文件的右键菜单就会有个Edit with IDLE,选它,就会打开成这样:

这就可以编辑代码并且运行了。


2、安装numpy

开始-运行-cmd

找到那个whl类型的numpy文件所在的目录(随便找个根目录放numpy文件就好了,不耽误安装),输入命令:pip install numpy-1.12.1-cp36-none-win_amd64.whl,就可以安装numpy

其实按照原本的文件名,应该输入的命令是:pip install numpy‑1.12.1+mkl‑cp36‑cp36m‑win_amd64.whl

不过我这里也是提示文件名不合法,所以我也改了名字,安装就成功了。


3、安装scipy

原理同numpy,执行pip install scipy-0.19.0-cp36-cp36m-win_amd64.whl


4、安装matplotlib

还是一样,执行pip install matplotlib-2.0.0-cp36-cp36m-win_amd64.whl


5、安装sklearn

我的安装文件是在github下载到的所以需要解压,之后在命令行里进入解压之后的文件夹,执行:pip install -U scikit-learn

即可安装成功。


==============================

以上就全部装好了,以下是跑那位大神的分析红楼的程序的记录。

之所以要安装numpy、matplotlib和sklearn,是因为人家的程序最后一步做主成分分析,相应的代码文件analysis.py有如下说明:

Prerequisite

"sklearn", "numpy" and "matplotlib" is needed to run this program.

可以在GitHub上看到:https://github.com/LouYu2015/analysis_on_the_story_of_a_stone

代码也可以下载到。唯一可能出现的问题是,原作者是用linux写的代码,我一开始试运行的时候preprocess.py发生了有关于gbk编码的错误,求教作者,得到回复是说windows编码的问题,作者帮忙改写出了一个preprocess_windows.py,输入的红楼原著全本的文件用hlm_ANSI.txt,就可以正常运行了。于是我接下来就把这个preprocess_windows.py改名叫preprocess.py,原来那个preprocess.py改成preprocess_linux.py,然后所有的程序畅通无阻。

比如红楼的词频统计:


可以看到,宝玉、贾母、凤姐、袭人、黛玉、王夫人、宝钗都是常常出现的词,这跟原书是一致的。这些角色的确经常出场或是被提及。原作者说,红楼里的人物似乎比较爱笑,因为“笑道”出现的次数也很多,这倒是个有趣的发现。

最后需要numpy、matplotlib和sklearn跑出这样的可视化结果:

对结果的分析请尽量去看原贴啦。

Python我是新手,这个帖子就只是做个记录以后再需要搞安装啥的好重现。

以上。

评论(1)
热度(2)

© 玛莉蓓尔的花房 | Powered by LOFTER