1、【单选题】【单选题】下列关于数据和数据分析的说法正确的是( )

  • A、数据就是数据库中的表格
  • B、文字、声音、图像这些都是数据
  • C、数据分析的数据只能是结构化的
  • D、数据分析不可能预测未来几天的天气变化

正确答案: B:文字、声音、图像这些都是数据;

2

【单选题】【单选题】下列关于数据分析流程的说法错误的是( )

  • A、需求分析是数据分析最重要的一部分
  • B、模型评价能够评价模型的优劣
  • C、分析与建模时只能够使用数值型数据
  • D、数据预处理是能够建模的前提

正确答案: C:分析与建模时只能够使用数值型数据;

3

【单选题】下列关于分析与建模流程的说法错误的是( )

  • A、分析与建模的模型选择要根据需求确定
  • B、分析与建模丁作是数据分析的核心
  • C、分析和建模时可以选择多个模型,同时分析
  • D、传统的统计对比分析不属于分析与建模流程

正确答案: D:传统的统计对比分析不属于分析与建模流程;

4

【单选题】下列关于模型评价与优化的说法正确的是( )

  • A、模型评价的目的是为了确认模型的有效性
  • B、所有的模型评价方法相同
  • C、模型评价结果良好,模型一定可用,不需要重构
  • D、模型构建完成就可以使用

正确答案: A:模型评价的目的是为了确认模型的有效性;

5

【单选题】下列不属于数据分析应用场景的是( )

  • A、计算机硬盘使用寿命预测
  • B、码头货物吞吐址预测
  • C、某人一生的命运预测
  • D、产品销拭分析

正确答案: C:某人一生的命运预测;

6

【单选题】下列不属于 Python 优势的是( )

  • A、拥有大量的第 方库,能够调用 C++ Java 语言
  • B、开源免费
  • C、语法简洁,程序开发速度快
  • D、程序的运行速度在所有计算机语言中最快

正确答案: D:程序的运行速度在所有计算机语言中最快;

知识点:

7

【单选题】Jupyter Notebook 不具备的功能是( )

  • A、Jupyter Notebook 可以将文件分享给他人
  • B、Jupyter Notebook 可以直接生成一份交互式文档
  • C、Jupyter Notebook 可以导出 HTML 文件
  • D、Jupyter Notebook 可以安装 Python

正确答案: D:Jupyter Notebook 可以安装 Python

一.单选题(共5题,100.0分)

1

【单选题】【单选题】下列对Python中的NumPy描述不正确的是( )。

  • A、NumPy的数据容器能够保存任意类型的数据
  • B、NumPy提供ndarray和array两种基本的对象
  • C、NumPy是用于数据科学计算的基础模块
  • D、NumPy能够对多维数组进行数值运算

正确答案: B:

知识点:

2

【单选题】【单选题】下列选项中表示数组维度的是( )。

  • A、size
  • B、shape
  • C、dtype
  • D、ndim

正确答案: D:ndim;

知识点:

3

【单选题】【单选题】代码“np.arange(0,1,0.2)”的运行结果为( )。

  • A、[0.2, 0.4, 0.6,0.8]
  • B、[0.,0.2, 0.4, 0.6,0.8]
  • C、[0.,0.2,0.4,0.6,0.8,1.0]
  • D、[0.2,0.4,0.6,0.8,1.0]

正确答案: B:[0.,0.2, 0.4, 0.6,0.8];

4

【单选题】【单选题】代码“np.linspace(0,10,5)”的运行结果为( )。

  • A、[ 0., 2.5., 5., 7.5., 10.]
  • B、[0., 2.5., 5., 7.5.]
  • C、[0,2.5,5,7.5]
  • D、[0,2.5,5,7.5,10]

正确答案: A:[ 0., 2.5., 5., 7.5., 10.];

5

【单选题】【单选题】下列用于横向组合数组的函数是( )

  • A、vstack
  • B、hsplit
  • C、vsplit
  • D、hstack

正确答案: D:hstack;

知识点:

.单选题(共8题,100.0分)

1

【单选题】下列关于pandas数据读/写说法正确的是( )

  • A、to_csv()方法能够将结构化数据写入CSV文件
  • B、read_sql函数能够读取所有数据库的数据
  • C、read_csv 函数无法读取文本文档的数据
  • D、to_csv()方法能够将结构化数据写入 Excel 文件

正确答案: A:

2

【单选题】下列关于pandas 基本操作说法错误的是( )。

  • A、在创建 DataFrame 的过程中可同时设置索引
  • B、在创建 DataFrame 后可设置索引
  • C、使用 describe()方法可以对 DataFrame 进行描述性统计
  • D、drop( )方法可以删除某列的数据

正确答案: C

3

【单选题】下列关于pandas支持的数据结构的说法错误的是( )。

  • A、pandas 支持 Series 和 DataFrame
  • B、Series 被定义为能够存储各种类型数据的一维数组
  • C、pandas 只支持 Series 数据结构
  • D、DataFrame 可与带有标记轴(行和列)的二维数组一起使用

正确答案: C:

知识点:

4

【单选题】以下分组操作中不涉及原始对象的是( )。

  • A、应用一个函数
  • B、分割对象
  • C、聚合数据
  • D、结合结果

正确答案: C:聚合数据;

5

【单选题】下列关于 apply( )方法说法正确的是( )。

  • A、apply( )方法无法应用于分组操作
  • B、apply( )方法作用范围:pandas 中的 Series 和 DataFrame
  • C、apply( )方法只能对行、列进行操作
  • D、apply( )方法中不能自定义函数

正确答案: B:apply( )方法作用范围:pandas 中的 Series 和 DataFrame;

知识点:

6

【单选题】下列关于分组聚合的说法错误的是( )。

  • A、pandas分组方法只有一个groupby()方法
  • B、pandas分组聚合操作能够实现组内标准化
  • C、使用 pandas的groupby()方法进行分组时,只能对列进行操作
  • D、pandas 聚合时能够使用agg()、apply()、transform()方法

正确答案: C:使用 pandas的groupby()方法进行分组时,只能对列进行操作;

7

【单选题】使用pivot_table函数制作透视表时可用下列( )参数设置行分组键

  • A、data
  • B、raw
  • C、values
  • D、index

正确答案: D:index;

知识点:

8

【单选题】下列对DataFrame 的常用属性说法错误的是( )。

  • A、column 可查看 DataFrame 的列名
  • B、dtypes 可查看各列的数据类型
  • C、values 可以获取元素
  • D、index 可查看索引情况

正确答案: A:column 可查看 DataFrame 的列名;

.单选题(共9题,100.0分)

1

【单选题】在下列选项中可以进行主键合并的是( )。

  • A、append( )
  • B、combine_first( )
  • C、concat
  • D、merge

正确答案: D

2

【单选题】在下列选项中可以进行横向堆叠的是( )。

  • A、join( )
  • B、concat
  • C、combine_first( )
  • D、merge

正确答案: B:concat

3

【单选题】在下列选项中可以进行重叠合并的是( )

  • A、combine_first( )
  • B、concat
  • C、merge
  • D、append( )

正确答案: A:combine_first( )

4

【单选题】下列关于pandas中drop_duplicates()方法的说法正确的是( )。

  • A、drop_duplicates()方法不会改变原数据的排列
  • B、drop_duplicates()是常用的主键合并方法,能够实现左连接和右连接
  • C、drop_duplicates(方法只对DataFrame有效
  • D、drop_duplicates()方法仅支持单一特征数据去重

正确答案: A:drop_duplicates()方法不会改变原数据的排列;

5

【单选题】下列关于特征去重的说法错误的是( )。

  • A、corr( )方法可通过相似度矩阵去重
  • B、可通过equals()方法进行特征去重
  • C、相似度矩阵去重可对任意类型的重复特征去重
  • D、相似度矩阵去重只能对数值型的重复特征去重

正确答案: C:相似度矩阵去重可对任意类型的重复特征去重;

知识点:

6

【单选题】在下列选项中可以进行特征删除的是( )。

  • A、dropna()方法
  • B、notnull( )方法
  • C、fillna()方法
  • D、isnull()方法

正确答案: A:dropna()方法;

7

【单选题】在下列选项中可以进行缺失值替换的是( )。

  • A、fillna()方法
  • B、notnull()方法
  • C、dropna()方法
  • D、isnull()方法

正确答案: A:fillna()方法;

8

【单选题】下列关于插值法的说法错误的是( )

  • A、线性插值通过求解线性方程得到缺失值
  • B、常见的线性插值拉格朗日插值牛顿插值
  • C、常见的插值法有线性插值、多项式插值和样条插值
  • D、pandas 中的interpolate()方法可进行插值操作

正确答案: B:常见的线性插值有拉格朗日插值和牛顿插值;

9

【单选题】在下列选项中可以进行哑变量处理的是( )。

  • A、dummies 函数
  • B、get_cut 函数
  • C、get_dummies 函数
  • D、cut 函数

正确答案: C:get_dummies 函数;

10在下列选项中不属于检测与处理缺失值的方法的是( )
A.插值法
B.替换法
C.哑变量处理
D.删除法 C

.单选题(共10题,100.0分)

1

【单选题】下列关于绘图的标准流程说法错误的是( )。

  • A、添加标题、坐标轴标签,绘制图形等步骤没有先后顺序
  • B、添加图例必须在绘制图形之后进行
  • C、绘图之前必须先创建画布,不可省略
  • D、绘图流程的最后部分是保存和显示图形

正确答案: C

2

【单选题】pyplot 使用 rc 配置文件来自定义图形的各种默认属性,用于修改线条上点的形状的rc参数名称是( )。

  • A、lines.markersize
  • B、lines.marker
  • C、lines.linestyle
  • D、lines.linewidth

正确答案: B:

3

【单选题】下列代码中能够为图形添加图例的是( )。

  • A、plt.xticks([0,1,2,3,4])
  • B、plt.plot(x, y)
  • C、plt.title(‘散点图’)
  • D、plt.legend(‘y = cos x’)

正确答案: D

4

【单选题】下列图形常用于分析各分组数据在总数据所占比例的是( )

  • A、箱线图
  • B、柱形图
  • C、饼图
  • D、折线图

正确答案: C

5

【单选题】下列说法不正确的是( )。

  • A、柱形图可以用于查看整体数据的数量分布
  • B、散点图可以用于查看数据中的离群值
  • C、箱线图可以用于查看特征间的相关关系
  • D、折线图可以用于查看数据的数量差异和变化趋势

正确答案: C

知识点:

6

【单选题】下列有关seaborn库说法正确的是( )。

  • A、在 seaborn 库的主题样式中 darkgrid 表示黑色背景
  • B、seaborn库是Matplotlib库的替代者
  • C、使用 despine 函数可以设置图形的边框
  • D、使用 set_context 函数可以设置主题样式

正确答案: C

7

【单选题】HLS颜色空间中的H表示为( )

  • A、空间大小
  • B、饱和度
  • C、色调
  • D、亮度

正确答案: C

8

【单选题】下列不是系列配置项的是( )。

  • A、标签配置项
  • B、文本样式配置项
  • C、标记点配置项
  • D、标题配置项

正确答案: D

9

【单选题】下列有关全局配置项说法错误的是( )。

  • A、全局配置项可以对标题、图例、坐标轴等的配置项进行配置
  • B、TitleOpts类和 AxisOpts 类的参数设置完全相同
  • C、使用LegendOpts类配置图例配置项
  • D、使用 TitleOpts 类配置标题配置项

正确答案: B

10

【单选题】下列说法正确的是( )。

  • A、stripplot 函数接收的数据只能是列表和数据框
  • B、基本散点图和 3D 散点图的绘制方法相同
  • C、热力图可用于了解数据集中的变量的相关关系
  • D、使用 stripplot 函数可以绘制线性回归拟合图

正确答案: C

.单选题(共5题,100.0分)

1

【单选题】skleam转换器的主要方法不包括( )。

  • A、transform( )
  • B、fit_transform( )
  • C、fit( )
  • D、fit_transforms( )

正确答案: D

2

【单选题】sklearn 中用于对特征进行归一化的函数是( )。

  • A、StandardScaler
  • B、Binarizer
  • C、MinMaxScaler
  • D、Normalizer

正确答案: D

3

【单选题】下列算法中属于分类方法的是( )。

  • A、SVC 算法
  • B、K-MEDOIDS 算法
  • C、CLARANS 算法
  • D、CLIOUE 算法

正确答案: A

4

【单选题】classification_report函数用于输出分类模型评价报告,其内容不包括( )。

  • A、true_postive_rate
  • B、fl-score I
  • C、recall
  • D、precision

正确答案: A

5

【单选题】下列关于回归模型评价指标说法不正确的是( )。

  • A、均方误差越接近0,模型性能越差
  • B、平均绝对误差的值越接近 0,模型性能越好
  • C、可解释方差越接近 0,模型性能越差。
  • D、R²值越接近1,模型性能越好

正确答案: A

二.多选题(共3题,30.0分)

1

【多选题】【多选题】下列关于 Jupyter Notebook 的描述错误的是( )

  • A、Jupyter Notebook Markdown 无法使用 LaTeX 语法
  • B、Jupyter Notebook 有两种单元形式
  • C、Jupyter Notebook 仅仅支待 Python 语言
  • D、Jupyter Notebook 有两种模式

2

【多选题】【多选题】下列关于 Python 数据分析库的描述错误的是( )

  • ANumPy 的在线安装不需要其他任何辅助工具
  • B、scikit-learn 包含所有算法
  • C、pandas 能够实现数据的整理工作
  • D、SciPy 的主要功能是可视化图表

正确答案: ABD

3

【多选题】【多选题】下列属于 Anaconda 主要特点的是( )

  • A、额外的加速和优化是免费的
  • B、包含了众多流行的科学、数学、工程、数据分析的 Python
  • C、支持 Python 2.6 2.7 3.4 3.5 3.6, 可自由切换
  • D、完全开源和免费

正确答案: BCD: