首页   注册   登录
 wqzjk393 最近的时间轴更新

wqzjk393

V2EX 第 202111 号会员,加入于 2016-11-19 23:13:27 +08:00
wqzjk393 最近回复了
15 小时 48 分钟前
回复了 pingpingping 创建的主题 问与答 你想让娃接受应试教育还是素质教育?
没有应试能力谁跟你谈素质教育啊。。我高中学校是全省出了名的素质教育基地,然而前提也是应试能力全省顶尖。何为素质教育,教的是自主学习、自律、个人道德等等,你以为就是单纯的减负教育啊,一个自律就够一生受益了。。。我们校训是博学博爱自律自强,校篮球队全市第一,也是常年霸占各种竞赛课外活动前几名的位置,够素质了吧,然而前提还是全市最好的生源加最好的成绩。没成绩谁跟你谈素质教育啊。相反有了成绩,素质教育就跟附赠的一样随着就来了,你也可以理解成优秀是一种习惯,好的只会更好。
数据分析的核心是统计学,其次才是各种封装好的科学计算包( pandas/numpy/scipy )可视化包(matplotlib/seaborn)。个人经验,统计学就老老实实看教材,包的话建议先从 numpy 入手,掌握和理解 numpy 的切片操作以后再学 pandas 就轻松多了。
pandas 其实用的多的还是读写 excel/csv,lambda 和 map/apply/applymap,pivot_table/cross_tab (其实很类似于 oracle 的分析函数"聚合函数+over(partition by/group by)" ),groupby,筛选(包括 where、df[df['aaa']=='bbb']等多种方式筛选,其实就类似于 sql 的 select where)、merge (相当于 sql 的 join )、drop_duplicates (去重)、dropna/fillna(删除空值或者填充空值)。所以你看 pandas 其实大部分时间用到的东西很有限的,学过 sql 的用 excel 分析过报表再学这个就感觉很轻松。
其实关键分析的还是要用 numpy 和 scipy,统计学应用就是要使用这两个的。而且 pandas 如果是做数据分析而不是仅仅做自动化报表,大部分还是要使用 df.values 转换成 numpy.ndarray 做分析。numpy 里面最麻烦的还是切片操作,这个很绕而且开始学的时候可能会感觉和自己的习惯很不一致,这没办法只有慢慢习惯才行。numpy 和 scipy 提供了均值方差峰度偏度中位数分位数等等各种统计函数,基本上能满足你大部分需求了。但是你要应用这些函数还是要理解均值方差峰度偏度等等这些概念的意义和作用,所以说关键还是在统计学理论知识,而不是科学计算包
杨箕那个广州军区医院口腔科,主要是人少而且技术也不比省口腔光华口腔这些差
14 天前
回复了 juanxincai 创建的主题 问与答 现在大数据是不是都归入算法岗了?
大数据是大数据,算法是算法。大数据是 java 平台 hadoop 系的,平常多是搭分布式系统,系统调优为主。机器学习算法和产品线主要是 python 平台的,平常更多用 sklearn、TensorFlow、torch 这些
14 天前
回复了 loyd2015 创建的主题 Apple macbook 外接显示器关闭内置屏幕
过年看春晚,我都是连上电视,然后电脑合一个很小的角度,然后等他自己黑屏。。
那么,表是用 sheet 还是 table 好呢
22 天前
回复了 coolqi 创建的主题 MacBook Pro mbp 要不要贴膜?
不要。我之前店里换了屏以后问店员要不要贴膜,店员说不建议。他说屏幕定期擦拭就好了,手指尽量不要摸屏幕就好,贴了膜反而会影响屏幕效果
关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   2978 人在线   最高记录 5043   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.3 · 10ms · UTC 00:57 · PVG 08:57 · LAX 17:57 · JFK 20:57
♥ Do have faith in what you're doing.