当前课程知识点:程序设计基础 > 第七章 文本数据处理 > 7.2 统计活跃用户数 > 7.2.3 程序翻译与演示
有了咱们刚才关于字符串的相关的知识
我们回过头来看一看
咱们活跃用户的这个程序要如何写
首先呢 就是读入4386个用户编号
要怎么读 首先为了存储这些编号
我们需要一个足够大的数组 刚才咱们说了
应该是大概是长成这样的一个二维数组
那这里呢 我们定义了一个叫ids
就是id加个s 就是很多id的意思了
然后有4500项的字符串的数组
其实我们知道的没有这么多只有4386项
但是呢 我把这个数组定义的稍微大一点
这样可以避免一些数组越界啊
这样一些我们不小心犯的错误
给它留足够的这样一些空间
然后后面这个20表示的是每一项
都是一个字符串最多要占20个字节
这20到底够不够呢 我们不知道
得去观察一下那个文件的内容
我们认为呢 所有用户的编号都不会
超过咱们说19个字节 那我就可以用
[20]来把它存下了 最后还要有一个\0
有了这样一个存储的一个位置
我们来看一看刚才这个读取文件的过程
其实整个这个代码跟前一个单元都是类似的
咱们刚才写到了一个从fin从这个文件当中
输入一个咱们叫id的这样一个字符串
那只不过呢说我这次呢每读一行
不能只做一个count++数一个计数了
还得把这个用户的编号实际的给它记下来
那到底怎么记呢 实际上我就是得把这个id
刚才读入的字符串放到数组当中去
到底放哪一项 那实际上我放到第count项
当中就行了 因为这个count随时在++
那一开始count初始化成0 那我第一项
就应该放在数组的第零项那个位置
所以放完了之后再去做这个count++
下一次循环回来的时候它就会放到第一项
然后再++ 下一次就会放到第二项
以此类推 所以呢 我们在这里加上一条
strcpy复制一个字符串 把它id的内容
拷贝到数组当中第count的位置就行了
在读入这4386个用户编号之后
按照咱们刚才的思路
咱们首先需要初始化一个计数的变量
这个没有问题了 咱们就定义一个新的变量
把它初始化成0就行了 只不过呢
咱们刚才的这个程序其实已经用过
名字叫count这样一个变量了
咱们把count这个变量用来表达的是
整个这个文件当中有多少条记录这样一个意义
那所以呢这里这个变量 这个计数
我就得给它起一个新的变量名
比如说我这里给它起名为user_count
中间加一个下划线 变量名是可以起成这样的
那接下来呢 是枚举这个数组
让下标当中 实际上就是让下标从0
到count这样一个for循环
好 我们把它写出来 那接下来呢
是找前面有没有相同的这样一个编号
比如说我们用线性查找法 因为我们知道
前面的编号其实也不一定非得是有顺序的吧
那我们就用线性查找法比较直观
那线性查找怎么做的呢 实际上就是
先假设我们没找到 也就是初始化一个变量
found = -1 表示没找到
然后呢我去循环 枚举前面的每一项
所以我这个循环的变量j是从0一直到小于i
然后比较一下 如果呢 一旦找到了
这个比较我用的是strcmp比较字符串的
这样一个函数 如果它的返回值等于0
表达的是这两个字符串的内容是完全一致的
那比较一下 如果找到了
我就可以记下这个位置 停止枚举
否则呢 继续做继续做
什么时候这个循环跳出结束了
我如果这个found还是-1 就说明没找到
如果这个found在中间被赋值了
然后break出来 说明找到了一个位置
那跳出来之后 如果没找到 也就是看
found这样一个变量 值是不是-1
如果是-1 说明没找到 那我就可以
认为这一个用户是一个新用户
我就应该把这个user_count
这样一个变量加上1 就是计数加1这样一个过程
好 把它写下来 写到这里呢
我们整个这个主要的功能也就完成了
接下来咱们把这样一些代码拷到编辑器当中
我们再浏览一下这个程序 为了使用字符串呢
我们首先要包含一个头文件
cstring 这样一个头文件
在下面会使用相关的字符串和一些函数
那其他的都一样 在这个统计活跃用户的时候
要加一个大的数组记住所有的编号
我用了4500条 然后每一条最长有20个字节
这样一个二维的数组来表达4500个字符串
这样一个存储位置 然后呢一个循环
跟我们上一节的循环是一样的
多了一条要把读出来的id
拷到前面数组对应的这个
count对应的这一项当中去
这样循环结束的时候
我就把所有的读到的行当中的id
都存到了数组当中去
因为这个count是依次++的
所以我这个4386条就会依次读到这个数组当中
然后读完了之后我就关闭文件了
然后下面做的这个求重复的操作
下面我们就初始化一个计数
一开始呢用户数的记录为0 然后呢一个循环
对每一项去它的前面去查找
这是个线性查找的过程 如果找到呢
说明它就重复了 就不用计数了
如果没找到 再去做这个user_count++
然后这个循环结束的时候再去把这个
user_count输出出来
好 就是这样一个整体的思路
我们把这样一个程序编译运行
看到输出结果是524 说明我们这样
尽管我们这个记录有四千多条
但是活跃的用户一共就524个同学
那大概就是平均每个同学会登入登出
一登入登出共8次 大概4次登入 4次登出这个样子
那既然运行结果告诉我们这四千多条
记录当中只涉及到了524个活跃用户
那说明我们其实这个4500个数组就有点浪费了
所以呢我们把这样一个程序再稍作修改
改成这个样子 我们这里存的数组的个数
就减少为600 我只需要其实存这524个不同的
用户id就足够我做这个有没有重复的判断了
那这样呢 我就可以直接在这个
每一条记录读出之后的循环里做这个查找的操作
还是跟之前一样的线性查找
那如果没找到的时候 我除了要把
user_count做一个++之外
还要把不同的这个id拷贝到数组当中去
这样呢 我这个数组当中只存的是
出现的不同的用户的编号 相同的呢
我就直接没有拷贝 这样省去了很多空间
那如果我们把这样一个程序一样编译运行
同样得到同样的结果 这个524个活跃用户
然后也没有出现我们之前数组越界的
这样非法操作 我这设的600足够包含下
524个不同的用户id
-1.1 基础知识
-1.2 买菜问题
-1.3 数学运算
-1.4 补充说明
-1.5 总结
--1.5 总结
-程设论道
--程设论道
-师生问答
-第一章 编程初步--语法自测
-2.1 关于超级计算器的几点思考
-2.2 电子秤模拟 — 背景介绍及需求分析
-2.3 电子秤模拟 — 代码实现
-2.4 变量定义与变量类型
-2.5 猜数游戏与数据表示
-2.6 关于变量的讨论
--公告
-2.7 变量体现的计算思维
-程设论道
--程设论道
-师生问答
--师生问答
-第二章 变量与代数思维--语法自测
-3.1 谁做的好事——语义表示
-3.2 谁做的好事——真假检查
-3.3 谁做的好事——循环枚举
-3.4 谁是嫌疑犯——多重循环枚举
-3.5 谁是嫌疑犯——破案线索表示
-3.6 谁是嫌疑犯——用二进制枚举
-程设论道
--程设论道一
--程设论道二
--程设论道三
-师生问答
-第三章 逻辑推理与枚举解题--语法自测
-4.1 插花游戏
-4.2 筛法
-4.3 线性查找
-4.4 折半查找
--4.4.1 提问
-4.5 排序问题
-4.6 总结
--4.6.1 总结
-程设论道
--程设论道二:筛法
-师生问答
-第四章 筛法与查找--语法自测
-5.1 阶乘
-5.2 排序
-5.3 矩阵填充
-5.4 分书与八皇后
-5.5 青蛙过河
-程设论道
--程设论道一
--程设论道二
-师生问答
--师生问答一
--师生问答二
-第五章 分治思想与递归--语法自测
-6.1 兔子数列问题
-6.2 分鱼问题
-6.3 橱窗的插花问题
-6.4 最长公共子序列问题
-程设论道
--程设论道一
--程设论道二
-师生问答
--师生问答
-第六章 递推与动态规划--语法自测
-7.1 统计记录总数
-7.2 统计活跃用户数
-7.3 统计在线时长
--7.3.2 结构
-7.4 总结
--7.4.1 总结
-程设论道
--程设论道
-师生问答
--师生问答
-第七章 文本数据处理--语法自测
-8.1 将数据组织成链表
-8.2 提高链表访问效率 —— 哈希链表
-8.3 以二进制文件存储链表
-程设论道
--程设论道一
--程设论道二
-师生问答
--师生问答
-第八章 非文本数据处理--语法自测
-9.1 自动售卖程序
-9.2 配制水果信息
-9.3 指定界面语言
-程设论道
--程设论道
-师生问答
--师生问答
-第九章 可配置的程序设计--语法自测