目录

第1关:统计字母数量

第2关:统计文章字符数

第3关:查询高校信息

第4关:查询高校名

第5关:通讯录读取

第6关:JSON转列表

第7关:利用数据文件统计成绩

第8关:研究生录取数据分析A

第9关:图书数据分析(A)


第1关:统计字母数量

读取附件是一篇英文短文,请编写程序统计这篇短文前 n 行中每一个英文字母出现的次数,结果按次数降序排列,次数相同时,按字母表顺序输出。若 n 值大于短文行数,输出整篇文章中每一个英文字母出现的次数(大写字母按小写字母统计)。 The Old Man and the Sea.txt

n = int(input()) # 输入需要统计的行数nfreq = {} # 创建一个空字典用来存储字母出现的次数f=open("step2/The Old Man and the Sea.txt", "r") # 打开文本文件for i, line in enumerate(f): # 遍历每一行if i >= n: # 如果行数大于等于n,则退出循环breakfor c in line: # 遍历每一个字符if c.isalpha(): # 如果是字母freq[c.lower()] = freq.get(c.lower(), 0) + 1 # 将字母转换为小写并统计出现次数,加入字典中freq_list = sorted(freq.items(), key=lambda x: (-x[1], x[0])) # 对字典按照出现次数降序排序,如果出现次数相同,则按照字母表顺序排序for item in freq_list: # 遍历字典print("{} 的数量是 {:>3} 个".format(item[0], item[1])) # 输出字母和出现次数for c in 'abcdefghijklmnopqrstuvwxyz': # 遍历所有小写字母if c not in freq: # 如果字母没有出现过print("{} 的数量是 {:>3} 个".format(c, 0)) # 输出字母和0次出现

第2关:统计文章字符数

读取附件中的文件(utf-8编码),统计并输出文章的前 n 行里共有多少字符(标点符号及换行符按字符统计),以及有多少个不重复的字符? The Great Learning.txt

def readFile(filename, num):with open(filename, 'r', encoding='utf-8') as file:# 只读模式打开文件content = file.readlines()# 文件全部内容读取出来放入列表中,每个元素为一行字符串txt = ''.join(content[:num])# 列表的前num行连接为字符串return len(txt), len(set(txt))# 以元组形式返回字符串长度和集合长度if __name__ == '__main__':num = int(input())# 输入读取文件行数name = 'step3/The Great Learning.txt'# 文件名content = readFile(name, num)# 传入文件和行数print(*content)# 将返回的元组解包输出

第3关:查询高校信息

附件 ‘university.csv’ 中包含北京主要高校的序号、学校名称、学校标识码、主管部门、所在地、办学层次、备注等信息,以逗号分隔符。 参考提示代码,将文件内容逐行读取到列表中,根据用户输入的学校名,查询学校信息并输出。 university.csv

示例

输入: 北京大学
输出: 序号,学校名称,学校标识码,主管部门,所在地,办学层次,备注 1,北京大学,4111010001,教育部,北京市,本科,

s=input().strip() #输入检索词with open('step4/university.csv', 'r', encoding='utf-8') as f:lines = f.read().split("\n")print(lines[0].strip())for i in lines:#遍历每一行if len(i) > 0:univers=i.split(",")[1]#拆分列表,得到学校if s in univers:#如果这一行有关键词print(i)

第4关:查询高校名

附件’university.csv’中包含北京主要高校的序号、学校名称、学校标识码、主管部门、所在地、办学层次、备注等信息,以逗号分隔符。 参考提示代码,将文件内容逐行读取到列表中,根据用户输入一个关键字,查询学校名称包含用户输入关键字的学校名并输出。 university.csv

示例

输入: 中央
输出: 中央财经大学 中央音乐学院 中央美术学院 中央戏剧学院 中央民族大学

name = input()with open('step5/university.csv','r',encoding='utf-8') as Uname:ls = Uname.read().split('\n')for line in ls:university_name = line.split(',')[1]if name in university_name:print(university_name)

第5关:通讯录读取

任务描述

info.csv 读取附件中的csv文件(通讯录信息),放入字典中(后两项以列表形式做为字典的值),并依次输出其中的信息。文件内数据不需要修改,输出时数据之间以空格间隔。 编码格式使用utf-8 输入‘A’时,按行输出文件信息 输入‘D’时,直接输出字典内容 输入其他数据时,输出“ERROR”

s = input()if s =="A":with open('step6/info.csv','r',encoding='utf-8') as f:txt = f.read()txt = txt.replace(","," ")print(txt)elif s =="D":with open('step6/info.csv','r',encoding='utf-8') as f:txt = f.readlines()dic = {}for line in txt:lis = list(line.strip().split(','))dic[lis[0]] = lis[1:]print(dic)else:print('ERROR') 

第6关:JSON转列表

任务描述

读取附件中的JSON文件,转为列表输出。 score1034.json

示例

输入: 2 输出:
[[‘姓名’, ‘学号’, ‘C’, ‘C++’, ‘Java’, ‘Python’, ‘C#’, ‘总分’], [‘刘雨’, ‘0121701100507’, ’20’, ’20’, ’20’, ’16’, ’20’, ’96’]]

import jsonwith open('step7/score1034.json','r',encoding='utf-8') as f:lis1 = json.loads(f.read())lis2 = [['姓名', '学号', 'C', 'C++', 'Java', 'Python', 'C#', '总分']]for i in lis1:lis2.append(list(i.values()))n = int(input())print(lis2[:n])

第7关:利用数据文件统计成绩

利用附件中的成绩数据进行成绩统计,根据总分进行升序排序后,输出总分最低分和最高分,按总分升序输出前n名同学和后n名同学成绩信息(n为非负数,当n大于数据行数时,按实际行数输出),输出每题的平均成绩。 (注:数据文件中最后一列是总分,第4-9列每列为一道题的成绩,打开与关闭文件代码已经给出) 成绩单.csv

n = int(input())ls1 = []ls2 = []with open('step8/成绩单.csv', 'r', encoding='utf-8') as f:for line in f.readlines():line = line.strip('\n')ls = list(line.split(','))ls1.append(ls) ls1.sort(key=lambda x: eval(x[9])) print('最低分{}分,最高分{}分'.format(ls1[0][9], ls1[len(ls1) - 1][9]))if n <= len(ls1):print(ls1[:n])print(ls1[(len(ls1) - n):])else:print(ls1)print(ls1)for j in range(3, 9):s = 0for i in ls1:s = s + eval(i[j])a = s / len(ls1)ls2.append(eval('%.2f' % a))print(ls2) 

第8关:研究生录取数据分析A

任务描述

admit2.csv 本题附件包含500名国际高校的研究生申请人的相关信息和预测的录取概率数据。 下表为文件中字段及对应含义:

Serial NoGRE ScoreTOEFL ScoreUniversity RatingSOPLORCGPAResearchChance of Admit
编号1-500GRE分数托福分数本科大学排名分个人陈述分数推荐信分数本科绩点研究经历(1/0)录取概率(0-1之间)

研究经历:1代表有,0代表无

录取概率:0-1之间的小数,如0.73代表73% 请按照下列要求对文件中数据进行统计和分析,并严格按照下面所示格式输出结果。 (描述中示例仅为格式示例,数据与测试用例无关)

输入一个数据n

1:如果n为’1’,抽取数据中录取概率大于等于80%的记录,计算其中大学排名评分大于等于4分的百分比,程序结束。

1 Top University in >=80%:11.11% 2:如果n为’Research’,分别统计和输出录取概率大于等于90%的学生和录取概率小于等于70%的学生中,有研究经历的学生占比,程序结束。(百分比保留两位小数)

Research Research in >=90%:91.03% Research in <=70%:22.10% 3:如果n为'2',输出录取概率大于等于80%的学生中TOEFL分数的平均分,最高分和最低分,程序结束。(保留两位小数)

2 TOEFL Average Score:300.12 TOEFL Max Score:323.00 TOEFL Min Score:299.00 4:如果n为’3’,输出录取概率大于等于80%的学生中绩点的平均分,最高分和最低分,程序结束。(保留三位小数)

3 CGPA Average Score:4.333 CGPA Max Score:4.910 CGPA Min Score:4.134 5:如果非以上输入,则输出’ERROR’,程序结束。

def readfile1(filename):#用于筛选出概率大于等于80%,返回列表ls = []with open(filename,"r") as fp:s = fp.readline()s = fp.readline()while s:l = s.strip().split(",")if eval(l[-1])>=0.8:ls.append(l)s = fp.readline()return lsdef readfile2(filename):#用于筛选出概率大于等于90%以及小于等于70%,返回列表ls1 = []ls2 = []with open(filename,"r") as fp:s = fp.readline()s = fp.readline()while s:l = s.strip().split(",")if eval(l[-1])>=0.9:ls1.append(l)if eval(l[-1])=4:cnt += 1print("Top University in >=80%%:%.2f%%"%(cnt/len(ls)*100))elif n == 'Research':ls1,ls2 = readfile2(filename)cnt1 = len([i for i in ls1 if i[-4] == '1'])#大于90%,且有研究经历的个数cnt2 = len([i for i in ls2 if i[-4] == '1'])#小于70%,且有研究经历的个数print("Research in >=90%%:%.2f%%"%(cnt1/len(ls1)*100))print("Research in <=70%%:%.2f%%"%(cnt2/len(ls2)*100))elif n=='2':ls = readfile1(filename)l = []#保存所有TOEFL分数for i in ls:l.append(float(i[3]))print("TOEFL Average Score:%.2f"%(sum(l)/len(l)))print("TOEFL Max Score:%.2f"%max(l))print("TOEFL Min Score:%.2f"%min(l))elif n=='3':ls = readfile1(filename)l = []#保存所有绩点分数for i in ls:l.append(float(i[-5]))print("CGPA Average Score:%.3f"%(sum(l)/len(l)))print("CGPA Max Score:%.3f"%max(l))print("CGPA Min Score:%.3f"%min(l))else:print("ERROR")

第9关:图书数据分析(A)

任务描述

CBOOK.csv
读取附件中的图书数据信息,并按照下列要求对数据进行统计分析(文件编码为utf-8) 文件包含信息格式:编号,书名,出版社,现价,原价,评论数,推荐指数 其中评论数形式为’1290021条评论’,书名可能包含书的简单描述,形如’雪落香杉树(福克纳奖得主,全球畅销500万册)’。

要求: 输入一个字符串 输入是’record’,统计输出图书数据的总数量,格式见示例 输入是’rank’,需要再输入一个书籍编号,分别输出编号对应的书籍信息(编号,书名,出版社,现价,原价,评论数,推荐指数),格式见示例 输入是’maxcomment’,输出评论数量最多的10本书的书名和评论数,按评论数量降序排序,格式见示例 输入是’maxname’,需要再输入一个数值n,输出书名最长的n本书的名字,按书名长度降序排序,格式见示例 非以上输入,输出’无数据’ 下列示例仅表明输入输出格式,输出的数据不是本题答案数据

def maxname(n):# 输出名字最长的十本书,长度相同以现价从高到低排序ls.sort(key=lambda x: (len(x[1]), eval(x[3])), reverse=True)for i in ls[:n]:print(i[1])def minname(n):# 输出名字最短的十本书ls.sort(key=lambda x: (len(x[1])))for i in ls[:n]:print(i[1])def priceNow():# 现价最高和最低l = sorted(ls, key=lambda x: eval(x[3]), reverse=True)for i in l[0][:-3]:print(i)for i in l[-1][:-3]:print(i)def priceOrgin():# 原价最高和最低l = sorted(ls, key=lambda x: eval(x[3]), reverse=True)for i in l[0][:-3]:print(i)for i in l[-1][:-3]:print(i)def number():print(len(ls))def maxcomment():# 评论数量多的书籍前10l = sorted(ls, key=lambda x: eval(x[-2][:-3]), reverse=True)for i in l[:10]:print(i[1], i[-2])def mincomment():# 评论数量少的书籍前10l = sorted(ls, key=lambda x: eval(x[-2][:-3]))for i in l[:10]:print(i[1], i[-2])def rank():n = input()for i in ls:if n == i[0]:for j in i:print(j)breakwith open('step10/CBOOK.csv', 'r') as f:ls = []for i in f.readlines()[1:]:ls.append(i.strip().split(','))c = input().lower()if c == 'record':number()elif c == 'rank':rank()elif c == 'maxname':n=eval(input())maxname(n)elif c == 'minname':n = eval(input())minname(n)elif c == 'nprice':priceNow()elif c == 'oprice':priceOrgin()elif c == 'maxcomment':maxcomment()elif c == 'mincomment':mincomment()else:print('无数据')