数据科学工程实践:用户行为分析与建模、A/B实验、SQLFlow在线阅读
会员

数据科学工程实践:用户行为分析与建模、A/B实验、SQLFlow

谢梁 缪莹莹 高梓尧 王子玲等
开会员,本书免费读 >

计算机网络数据库13万字

更新时间:2021-06-24 11:29:59 最新章节:12.4 本章小结

立即阅读
加书架
下载
听书

书籍简介

这是一本将数据科学三要素——商业理解、量化模型、数据技术全面打通的实战性著作,是来自腾讯、滴滴、快手等一线互联网企业的数据科学家、数据分析师和算法工程师的经验总结,得到了SQLFlow创始人以及腾讯、网易、快手、贝壳找房、谷歌等企业的专家一致好评和推荐。全书三个部分,内容相对独立,既能帮助初学者建立知识体系,又能帮助从业者解决商业中的实际问题,还能帮助有经验的专家快速掌握数据科学的Z新技术和发展动向。内容围绕非实验环境下的观测数据的分析、实验的设计和分析、自助式数据科学平台3大主题展开,涉及统计学、经济学、机器学习、实验科学等多个领域,包含大量常用的数据科学方法、简洁的代码实现和经典的实战案例。第1部分(第1~6章)观测数据的分析技术讲解了非实验环境下不同观测数据分析场景所对应的分析框架、原理及实际操作,包括消费者选择偏好分析、消费者在时间维度上的行为分析、基于机器学习的用户生命周期价值预测、基于可解释模型技术的商业场景挖掘、基于矩阵分解技术的用户行为规律发现与挖掘,以及在不能进行实验分析时如何更科学地进行全量评估等内容。第二部分(第7~9章)实验设计和分析技术从A/B实验的基本原理出发,深入浅出地介绍了各种商业场景下进行实验设计需要参考的原则和运用的方法,尤其是在有样本量约束条件下提升实验效能的方法及商业场景限制导致的非传统实验设计。第三部分(第10~12章)自助式数据科学平台SQLFlow针对性的讲解了开源的工程化的自助式数据科学平台SQLFlow,并通过系统配置、黑盒模型的解读器应用、聚类分析场景等案例帮助读者快速了解这一面向未来的数据科学技术。
品牌:机械工业出版社
上架时间:2021-06-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

同类热门书

最新上架

  • 会员
    达梦数据库是一款非常优秀的国产数据库。本书从实用角度,通过对达梦数据库的体系结构、运行机制的讲解,以及与其他数据库相似功能的对比,帮助读者掌握达梦数据库的基本操作。本书第1章讲解达梦数据库的安装部署;第2章讲述达梦数据库的体系结构,并与Oracle的体系结构进行对比;第3章讲解数据库中最重要的两部分redo和undo;第4章介绍用户管理,重点讲述用户创建和权限;第5章讲解表和索引,并对普通表和堆表
    付强编著计算机10.7万字
  • 会员
    本书围绕数据挖掘竞赛,讲解了各种类型数据挖掘竞赛的解题思路、方法和技巧,并辅以对应的实战案例。全书共11章。第1章介绍数据挖掘竞赛的背景、意义和现状。从第2章开始,介绍了各种不同类型的数据挖掘竞赛包括结构化数据、自然语言处理、计算机视觉(图像)、计算机视觉(视频)、强化学习。每种类型的数据挖掘竞赛包含理论篇和实战篇:理论篇介绍通用的解题流程和关键技术;实战篇选取比较有代表性的赛题,对赛题的优秀方案
    许可乐编著计算机6.7万字
  • 会员
    本书以Python数据分析与挖掘的常用技术与真实案例相结合的方式,深入浅出地介绍Python数据分析与挖掘的重要内容。本书共11章,分为基础篇(第1~5章)和实战篇(第6~11章),基础篇包括数据挖掘基础、Python数据挖掘编程基础、数据探索、数据预处理、数据挖掘算法基础等基础知识;实战篇包括6个案例,分别为信用卡高风险客户识别、餐饮企业菜品关联分析、金融服务机构资金流量预测、O2O优惠券使用预
    翟世臣 张良均主编计算机13.6万字
  • 会员
    本书以案例的形式,介绍从思维模型分析到场景实践的数据分析方法。全书围绕“数据分析”与“运营增长”两大关键要素,在系统介绍数据分析思维、数据分析方法、数据采集技能、数据清洗技能等基础知识的同时,以问题为导向,解读运营与增长的关键性业务内容,在获客、激活、留存、变现、自传播循环等各个核心运营环节展开数据分析实战。本书提供案例相关数据集与源码包,适合数据分析、产品运营、市场营销等行业有数据分析具体业务需
    黄佳计算机12万字
  • 会员
    这是一套数据指标体系全流程构建(从规划、框架设计、数据采集加工到应用)方法论与实践指南。它不仅深入浅出地分享了通用的数据指标体系构建策略,还通过多个行业实例展示了具体操作方法。书中从数据采集入手,借助BI工具Superset实践构建过程。本着“一切技术都是为业务服务的”这一宗旨,本书除了包含数据指标体系构建相关内容外,还结合统计学原理及Excel、Python等工具,深入剖析数据指标波动对业务的影
    李渝方计算机12.7万字
  • 会员
    本书旨在向广大有志于投身芯片设计行业的人士及正在从事芯片设计的工程师普及芯片设计知识和工作方法,使其更加了解芯片行业的分工与动向。本书共分9个章节,从多角度透视芯片设计,特别是数字芯片设计的流程、工具、设计方法、仿真方法等环节。凭借作者多年业内经验,针对IC新人关心的诸多问题,为其提供了提升个人能力,选择职业方向的具体指导。本书第1章是对IC设计行业的整体概述,并解答了IC新人普遍关心的若干问题。
    白栎旸编著计算机29.9万字
  • 会员
    《数据分析实践:专业知识和职场技巧》从初学者的角度出发,讲解了进阶为高级数据分析师所需的知识和技能,其中既包括数据分析岗位的介绍、发展现状及未来趋势,也包括实际工作中各环节的方法策略、实战案例,还包括职场中的困惑解答及面试指导。阅读本书,并基于本书进一步拓展所需要的知识能,可以帮助读者形成一套成系统、可实战的数据分析方法论。
    姜文哲计算机19.6万字
  • 会员
    数据科学的关键技术包括数据存储计算、数据治理、结构化数据分析、语音分析、视觉分析、文本分析和知识图谱等方面。本书的重点是详细介绍文本分析和知识图谱方面的技术。文本分析技术主要包括文本预训练模型、多语种文本分析、文本情感分析、文本机器翻译、文本智能纠错、NL2SQL问答以及ChatGPT大语言模型等。知识图谱技术主要包括知识图谱构建和知识图谱问答等。本书将理论介绍和实践相结合,详细阐述各个技术主题的
    苏海波 刘译璟 易显维 苏萌计算机21.6万字
  • 会员
    本书是一本介绍分布式数据库基础内容与应用的大数据专业类图书,力求培养读者对分布式数据库的应用技能。本书共11章,采用原理+代码实例+综合案例的编写形式,清晰明了地介绍分布式数据库的原理、基础应用、进阶应用及主流工具的使用方法、应用场景,以理实结合为编写要求,让读者能够轻松学习和掌握分布式数据库的内容。本书可以作为高等院校计算机、网络技术等相关专业的教材,也可以作为数据库相关工作的从业人员的参考用书
    闭应洲 许桂秋 刘军主编计算机14万字

同类书籍最近更新

  • 会员
    本书共分为三篇:一篇介绍数据库基础知识,重点是关系数据库理论;第二篇关注实践,重点是数据库服务器端的维护和管理;第三篇讨论数据库应用结构、数据访问接口以及应用领域和发展方向。附录用一个完整的示例说明了数据库设计的全过程。本书选用SQLServer2012作为数据库实践平台。本书注重理论与应用的结合,内容全面,实例丰富,并配有电子教案。本书可作为高等院校非计算机专业的数据库教材,也可作为计算机专
    张千帆数据库11.8万字
  • 会员
    本书是武汉工程大学王海晖、刘宝忠主编的《大学计算机基础》配套的实验指导教材。本书主要包括两个部分,第一部分为实验,内容包含6个实验,主要包括:计算机基本操作实验、Windows7操作系统实验、Office2010办公软件实验、网络基础实验、Photoshop图像处理实验、视频制作和处理实验;第二部分则包含了与主教材各章内容对应的全部习题。
    吴静 谢芳主编数据库13万字
  • 会员
    本书以大型数据库管理系统SQLServer2012为平台,通过一个贯穿全书的实例“天意购物”数据库,详细讲解了SQLServer2012的安装和配置,数据库的创建与管理,表、视图、索引、T-SQL语言、存储过程和触发器,数据库的备份恢复与导入导出,SQLServer的安全管理等内容。本书共分为绪论和6个项目,内容包括数据库基础知识、“天意购物”数据库设计与实现、“天意购物”数据库中数据表的创建与管
    刘玥数据库5.1万字
  • 会员
    本书详细介绍ProxmoxVE。ProxmoxVE是一个完整的企业虚拟化开源平台,具有去中心化的超融合特性。ProxmoxVE与前端负载均衡整合,可实现关键应用的高可用性。全书共15章,大致可分为几个部分:第1章和第2章为概述部分,主要介绍ProxmoxVE的基本特性及功能;第3~6章为基础部分,总览ProxmoxVE部署、简单管理等操作;第7~10章为项目实战,也是本书的精华部分,介绍
    田逸数据库8.6万字
  • 会员
    本书以数据流上的频繁模式和高效用模式挖掘计算为背景,介绍该领域相关的概念、理论及近年来相关的最新研究成果,内容包括传统数据集中的频繁模式挖掘及其大数据集下的频繁模式挖掘算法、不确定数据流中的频繁模式挖掘算法、具有效用值的数据流中的高效用模式挖掘算法。
    王乐数据库5.7万字
  • 会员
    本书分为25章,包括SQLServer2008的最基本、最常用、最重要的知识,同时通过贯穿全文的实例使读者更易、更快地掌握各章的知识点,最后通过实际应用中的完整实例让读者顺利地将所学理论知识运用到实际工作中去。全书内容由浅入深,并辅以大量的实例说明,使读者能更快、更好地掌握SQLServer2008。本书可供初学者作为入门书籍,也可为有一定的SQLServer编程基础的程序员作为参考用书
    希赛IT发展研究中心组编数据库28.4万字