excel数据的微分怎么计算 Python的Numpy、Scipy、Pandas模块有什么区别?

[更新]
·
·
分类:行业
1438 阅读

excel数据的微分怎么计算

Python的Numpy、Scipy、Pandas模块有什么区别?

Python的Numpy、Scipy、Pandas模块有什么区别?

当我们使用Python进行数据分析时,有时可能需要根据DataFrame其他列中的值向pandas DataFrame添加一列。
  尽管这听起来很简单,但是如果我们尝试使用if-else条件语句来做,可能会变得有些复杂。值得庆幸的是,有一种使用numpy做到这一点的简单,好方法!
  要学习如何使用它,我们来看一个特定的数据分析问题。我们拥有4,000多个AAA教育推文的数据集。附有图像的推文会获得更多的赞和转发吗?让我们做一些分析找出答案!
  我们将从导入pandas和numpy开始,并加载数据集以查看其外观。
  我们可以看到我们的数据集包含有关每个推文的一些信息,包括:
  1)date —推文发布的日期
  2)time —发推文的时间
  3)tweet -该推文的实际文本
  4)mentions -推文中提及的任何其他Twitter用户
  5)photos —推文中包含的任何图像的URL
  6)replies_count -在推文上的回复数量
  7)retweets_count -推文的转发数
  8)likes_count —在推文上的喜欢次数
  我们还可以看到photos数据的格式有些奇怪。
  使用np.where()添加具有正确/错误条件的pandas列
  对于我们的分析,我们只想查看带有图像的推文是否获得更多的交互,因此我们实际上不需要图像URL。让我们尝试创建一个名为的新列hasimage,该列将包含布尔值- True如果该tweet包含图像,False则不包含图像。
  为此,我们将使用numpy的内置where()函数。此函数按顺序接受三个参数:我们要测试的条件,条件为true时分配给新列的值以及条件为false时分配给新列的值。看起来像这样:
  在我们的数据中,我们可以看到没有图像的推文始终[]在该photos列中具有值。我们可以使用信息并np.where()创建新列hasimage,如下所示:
  在上方,我们可以看到我们的新列已添加到我们的数据集,并且已正确标记了tweet,其中包括图像为True,其他图像为False。
  现在我们有了hasimage专栏,让我们快速制作几个新的DataFrame,一个用于所有图像推文,一个用于所有无图像推文。我们将使用布尔过滤器进行此操作:
  现在,我们已经创建了那些,我们可以使用内置的数学函数.mean()来快速比较每个DataFrame中的推文。
  我们将使用print()语句使结果更易于阅读。我们还需要记住使用str()来将.mean()计算结果转换为字符串,以便可以在我们的打印语句中使用它:
  根据这些结果,似乎包括图像可能会促进AAA教育的更多社群媒体的交互。有图片的推文的平均赞和转发次数是没有图片的推文的三倍。
  添加条件更复杂的pandas专栏
  这种方法效果很好,但是如果我们想添加一个条件更复杂的新列(超出True和False的条件)怎么办?
  例如,为了更深入地研究这个问题,我们可能要创建一些交互性“层”,并评估到达每个层的推文所占的百分比。为了简单起见,让我们使用Likes来衡量交互性,并将tweet分为四个层次:
  1)tier_4 -2个或更少的喜欢
  2)tier_3 — 3-9个赞
  3)tier_2 — 10-15个赞
  4)tier_1 — 16个赞
  为此,我们可以使用称为的函数()。我们给它两个参数:一个条件列表,以及一个我们想要分配给新列中每一行的值的对应列表。
  这意味着顺序很重要:如果conditions满足列表中的第一个条件,则列表中的第一个值values将分配给该行的新列。大数据分析使用numpy在pandas dataframe上添加列如果满足第二个条件,则将分配第二个值,等等。
  让我们看一下它在Python代码中的外观:
  太棒了!我们创建了另一个新列,该列根据我们的(虽然有些武断)层排名系统对每个tweet进行了分类。
  现在,我们可以使用它来回答有关我们的数据集的更多问题。例如:1级和4级推文中有多少百分比具有图像?
  在这里,我们可以看到尽管图像似乎有所帮助,但它们似乎并不是成功所必需的。
  尽管这是一个非常肤浅的分析,但我们已经在这里实现了我们的真正目标:根据有关现有列中值的条件语句向pandas DataFrames添加列。
  当然,这是可以以多种方式完成的任务。np.where()而()只是许多潜在的两种方法。

为什么许多人建议本科学数学,研究生阶段转金融或者计算机?学数学的发展方向只有纯数学计算机以及金融吗?

首先本人毕业于一个一般211的数学学院,研究生读的是计算机!
首先,我认为在大学里如果确定读研,最好的专业可以选择应用数学或者统计,因为这两个专业你想转任何理工专业的研究生都还是比较轻松的,计算机,电子,经济,金融,管理都可以转,而且甚至比哪些本专业的学生更受导师喜欢!
其实,我结合我自己的体会说一说为什么计算机的导师喜欢数学毕业的。研究生最重要的工作是研究,本人是做图像处理的,这个领域的大部分算法其实都是数学模型,和矩阵分析处理,至于计算机的专业知识其实并不多,只要你掌握一门程序设计基本上就可以了。那为什么会比计算机毕业的学生还要受欢迎呢,因为其实计算机越往上走越和数学结合更紧密,而数学基础知识理论是很难补,本科的高等数学和线性代数就难倒了很多非数学专业的同学了,更何况数学专业一般都学的是数学分析和高等代数,在加上泛函,复变函数,数理统计,线性规划和非线性规划这些都是需要大量的练习才能更好的理解的,那你让一个研究生去做这些是根本不可能的也是不现实的!而读计算机的研究生阶段的计算机专业知识是很少的,也是比较好学的!
所以,我认为大学里学数学是不吃亏的,当然,从就业上来看,数学的就业比计算机无论从就业率和薪资上都有很大差距,但是学数学读研无论从读论文到写论文都有很大的优势的