L2-039 清点代码库 (25 分)
上图转自新浪微博:“阿里代码库有几亿行代码,但其中有很多功能重复的代码,比如单单快排就被重写了几百遍。请设计一个程序,能够将代码库中所有功能重复的代码找出。各位大佬有啥想法,我当时就懵了,然后就挂了。。。”
这里我们把问题简化一下:首先假设两个功能模块如果接受同样的输入,总是给出同样的输出,则它们就是功能重复的;其次我们把每个模块的输出都简化为一个整数(在 int 范围内)。于是我们可以设计一系列输入,检查所有功能模块的对应输出,从而查出功能重复的代码。你的任务就是设计并实现这个简化问题的解决方案。
输入格式:
输入在第一行中给出 2 个正整数,依次为 N(≤104)和 M(≤102),对应功能模块的个数和系列测试输入的个数。
随后 N 行,每行给出一个功能模块的 M 个对应输出,数字间以空格分隔。
输出格式:
首先在第一行输出不同功能的个数 K。随后 K 行,每行给出具有这个功能的模块的个数,以及这个功能的对应输出。数字间以 1 个空格分隔,行首尾不得有多余空格。输出首先按模块个数非递增顺序,如果有并列,则按输出序列的递增序给出。
注:所谓数列 { A1, …, AM } 比 { B1, …, BM } 大,是指存在 1≤i<*M*,使得 *A*1=*B*1,…,*Ai*=*Bi* 成立,且 *Ai*+1>B+1。
输入样例:
| 7 3 35 28 74 -1 -1 22 28 74 35 -1 -1 22 11 66 0 35 28 74 35 28 74
|
输出样例:
| 4 3 35 28 74 2 -1 -1 22 1 11 66 0 1 28 74 35
|
程序源代码:
利用map的映射关系
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41
| #include<bits/stdc++.h> using namespace std; map<vector<int>,int> mp; vector<int> tmp; int n,m; bool cmp(pair<vector<int>,int> a,pair<vector<int>,int> b) { if(a.second==b.second) { return a.first<b.first; } return a.second>b.second;
} int main() { cin>>n>>m; for (int i = 0; i <n ; ++i) { for (int j = 0; j < m; ++j) { int num; cin>>num; tmp.push_back(num); } mp[tmp]++; tmp.clear(); } vector<pair<vector<int>,int>> v(mp.begin(),mp.end()); cout<<v.size()<<endl; sort(v.begin(),v.end(),cmp); for (int k = 0; k <v.size() ; ++k) { cout<<v[k].second<<" "; for (int i = 0; i <m ; ++i) { if(i!=m-1){ cout<<v[k].first[i]<<" "; } else{ cout<<v[k].first[i]<<endl; } } } return 0; }
|
参考资料:
题目详情 - L2-039 清点代码库 (25 分) (pintia.cn)