图灵程序设计丛书

机器学习系统设计

Willi Richert , Luis Pedro Coelho (作者) 刘峰 (译者)
如今,机器学习正在互联网上下掀起热潮,而Python则是非常适合开发机器学习系统的一门优秀语言。作为动态语言,它支持快速探索和实验,并且针对Python的机器学习算法库的数量也与日俱增。本书最大的特色,就是结合实例分析教会读者如何通过机器学习解决实际问题。

本书将向读者展示如何从原始数据中发现模式,首先从Python与机器学习的关系讲起,再介绍一些库,然后就开始基于数据集进行比较正式的项目开发了,涉及建模、推荐及改进,以及声音与图像处理。通过流行的开源库,我们可以掌握如何高效处理文本、图片和声音。同时,读者也能掌握如何评估、比较和选择适用的机器学习技术。

举几个例子,我们会介绍怎么把StackOverflow的回答按质量高低进行分类,怎么知道某个音乐文件是爵士风格,还是重金属摇滚风格。另外,本书还涵盖了主题建模、购物习性分析及云计算等高级内容。总之,通过学习本书,读者可以掌握构建自己所需系统的各方面知识,并且学以致用,解决自己面临的现实问题。

读者只要具有一定的Python编程经验,能够自己安装和使用开源库,就足够了,即使对机器学习一点了解都没有也没关系。本书不会讲机器学习算法背后的数学。
电子书
¥19.99
格式
mobi   pdf

纸质书
¥44.10 ¥49.00

出版信息

  • 书  名机器学习系统设计
  • 系列书名图灵程序设计丛书
  • 执行编辑关于本书的内容有任何问题,请联系 岳新欣
  • 出版日期2014-06-13
  • 书  号978-7-115-35682-6
  • 定  价49.00 元
  • 页  数224
  • 印刷方式黑白
  • 开  本16开
  • 出版状态上市销售
  • 原书名Building Machine Learning Systems with Python
  • 原书号978-1782161400

同系列书

  • HTTP权威指南

    David Gourley   Brian Totty   Marjorie Sayer   Sailu Reddy   Anshu Aggarwal   陈涓   赵振平   译

    本书是HTTP及其相关核心Web技术方面的权威著作,主要介绍了Web应用程序是如何工作的,核心的因特网协议如何...

  • JavaScript高级程序设计(第3版)

    Nicholas C.Zakas   李松峰   曹力   译

    本书是JavaScript超级畅销书的最新版。ECMAScript 5 和HTML5在标准之争中双双胜出,使大...

  • 计算机科学的基础

    Al Aho   Jeff Ullman   傅尔也   译

    本书全面而详细地阐述了计算机科学的理论基础,从抽象概念的机械化到各种数据模型的建立,用算法、数据抽象等核心思想...

  • Java技术手册(第6版)

    Benjamin J Evans   David Flanagan   安道   译

    通过学习本书,你将能够: 掌握最新的语言细节,包括Java 8的变化 使用基本的Java句法学习面向对...

  • 机器学习实战

    Peter Harrington   李锐   李鹏   曲亚东   王斌   译

    机器学习是人工智能研究领域中一个极其重要的研究方向,在现今的大数据时代背景下,捕获数据并从中萃取有价值的信息或...

本书特色

微软Bing核心团队成员手把手教你用Python设计机器学习系统

“机器学习本身很复杂,且在具体的数据分析实践中涉及大量复杂的数学知识。而本书尽量避开编程与机器学习算法实现的复杂性,让机器学习代码尽量简单。它的目的不是阐明机器学习‘是什么’,而是解释‘如何’编写算法,并帮助你思考‘什么是最好的’编程方式。”——亚马逊读者评论

目录

版权声明 阅读
译者序 阅读
作者致谢 阅读
关于作者 阅读
关于审校者 阅读
前言 阅读
第1章 Python机器学习入门 阅读
第2章 如何对真实样本分类
第3章 聚类:寻找相关的帖子
第4章 主题模型
第5章 分类:检测劣质答案
第6章 分类II:情感分析
第7章 回归:推荐
第8章 回归:改进的推荐
第9章 分类III:音乐体裁分类
第10章 计算机视觉:模式识别
第11章 降维
第12章 大数据
附录A 更多机器学习知识

作者介绍

Willi Richert(作者)机器学习和机器人学博士,目前任职于微软Bing搜索核心研发团队。他从事多种机器学习领域的研究,包括主动学习和统计机器翻译。

Luis Pedro Coelho(作者)计算生物学家,主要关注生物图像信息学和大规模图像数据的处理,致力于生物标本图像分析中机器学习技术的应用,他还是Python计算机视觉库mahotas的主要开发人员。他于1998年开始开发开源软件,2004年起从事Python开发,并为多个Python开源库贡献了代码。另外,Luis拥有机器学习领域世界领先的卡内基-梅隆大学的博士学位,并发表过多篇科学论文。

刘峰(译者)百度LBS地图基础业务部资深研发工程师,新加坡南洋理工大学计算机工程系博士,研究领域包括机器学习、模糊神经网络等。2010年加入百度,主要从事大数据分析和挖掘方面的工作,近年来专注于无线定位、用户轨迹等LBS大数据的挖掘及机器学习应用。

大家也喜欢

  • 机器学习

    Peter Flach   段菲   译

    被誉为内容最全面的机器学习教材,Machine Learning期刊主编力作 “本书写作思路清楚,逻...

  • 机器学习实践:测试驱动的开发方法

    Matthew Kirk   段菲   译

    本书介绍在开发机器学习算法时如何运用测试驱动的方法,捕捉可能扰乱正常分析的错误。这本实践指南从测试驱动开发和机...

  • 图解机器学习

    杉山将   许永伟   译

    <内容摘要> 本书用丰富的图示,从最小二乘法出发,对基于最小二乘法实现的各种机器学习算法进行了详细的介绍。第...

  • 之前对于翻译的批评太温和了。恕我直言,本书的翻译质量已经差到了影响理解的程度。
    在我阅读本书的过程中,以下几种情况时刻伴随着我,手机打字,我就不举例说明了:
    1.句子完全是直译的,句子结构没有根据中文的特点和上下文语境进行适当的调整。不过既然句子成分都是按照原文顺序一一对译的,我可以在脑海中一一对应成原文来理解。
    2.词汇翻译时,义项选择不对,结果导致整句话读起来莫名其妙。由此可以推见,不是译者不负责任,而是他根本就不知道有这个义项,他本人都没有理解原文,怎么能正确翻译呢?如果译者选取了这个词最常见的义项,我往往也能推断出原词,从而理解作者想表达的意思。不过,有些时候我根本猜不出来。
    3.短语翻译时,尤其是熟语和俚语,居然也逐词直译。同上,我觉得译者本人都没有理解原文。
    4.英文缩略词首次出现时,不补充翻译。由于英文本身的特点,原文读起来是通顺的。但是读中文的时候你无从得知这个缩略词和上文某个短语的首字母相吻合。

    对于不懂英文的人来说,很多地方简直莫名其妙。对于懂英文的人来说,看译文需要自行猜测出原文才能读懂。那我为什么不直接读原文,还免得猜原文是什么了?

    我阅读过不少图灵出版的译作,其中不乏翻译优秀,乃至于翻译的十分精妙,青出于蓝而胜于蓝的作品。这次难免让我有些失望,愿图灵以后加强对译者的把关。
    张宁宁  发表于 2016-03-25 11:03:27
  • 什么时候出来啊
    jsontang0515  发表于 2014-03-26 21:20:05
  • 我靠,我还以为可以立马下单了
    jsontang0515  发表于 2014-03-26 21:20:22
  • 哇,感觉还是很期待这本书的哦。
    fdy1045  发表于 2013-08-08 17:06:37
  • 希望有电子版
    云游天外  发表于 2014-06-03 20:48:36
  • 相对基础 但是里面代码挺乱的
    babam  发表于 2014-06-26 16:02:25
  • 居然不能用49个银子购买
    汤旭_SIST  发表于 2014-07-12 16:45:58
  • 作为译者,有必要说一下,里面的代码都是截取的代码片段,很可能缺少一些变量的赋值,导致无法运行。因此最好参考附带的完整源码进行阅读。
    刘峰  发表于 2014-07-23 23:52:36
  • 买了纸版的,在看
    splade  发表于 2015-01-05 22:13:14
  • 6.2 获取推特(Twitter)数据 说用 install.py 获取数据,但这个脚本执行时说缺少 corpus.csv,可压根 code 包里就没这个文件,谁知道这个怎么解决吗?
    xueyingxue001  发表于 2015-11-27 11:28:00
  • 内容不错,翻译有些生硬。
    张宁宁  发表于 2016-03-14 18:31:40
  • 电子书怎么下载不了。代码可以下载得下来。
    XueTr  发表于 2016-08-13 12:01:01
合作: 网上娱乐场 博狗体育 新葡京娱乐场