将想要的状态,
以“彩色”在大脑中呈现!

数据结构与算法 第3页

自猿其说记录站长成长点滴,将工作所学所思所看分享到这里,介绍基础数据结构,常用算法,进阶算法,编程经验,常见面试算法,希望您能通过本站有所成长。

海量数据处理 多层划分

ProMonkey阅读(236)评论(0)赞(0)

多层划分 方法介绍 多层划分法,本质上还是分而治之的思想,因为元素范围很大,不能利用直接寻址表,所以通过多次划分,逐步确定范围,然后最后在一个可以接受的范围内进行。 问题实例 1、2.5亿个整数中找出不重复的整数的个数,内存空间不足以容纳这...

海量数据处理 外排序

ProMonkey阅读(218)评论(0)赞(0)

外排序 方法介绍 所谓外排序,顾名思义,即是在内存外面的排序,因为当要处理的数据量很大,而不能一次装入内存时,此时只能放在读写较慢的外存储器(通常是硬盘)上。 外排序通常采用的是一种“排序-归并”的策略。 在排序阶段,先读入能放在内存中的数...

海量数据处理 simhash算法-自猿其说

海量数据处理 simhash算法

ProMonkey阅读(246)评论(0)赞(0)

simhash算法 方法介绍 背景 如果某一天,面试官问你如何设计一个比较两篇文章相似度的算法?可能你会回答几个比较传统点的思路: 一种方案是先将两篇文章分别进行分词,得到一系列特征向量,然后计算特征向量之间的距离(可以计算它们之间的欧氏距...

海量数据处理 分而治之-自猿其说

海量数据处理 分而治之

ProMonkey阅读(229)评论(0)赞(0)

分而治之 方法介绍 对于海量数据而言,由于无法一次性装进内存处理,导致我们不得不把海量的数据通过hash映射分割成相应的小块数据,然后再针对各个小块数据通过hash_map进行统计或其它操作。 那什么是hash映射呢?简单来说,就是为了便于...

海量数据处理

ProMonkey阅读(228)评论(0)赞(0)

本章导读 所谓海量数据处理,是指基于海量数据的存储、处理、和操作。正因为数据量太大,所以导致要么无法在较短时间内迅速解决,要么无法一次性装入内存。 事实上,针对时间问题,可以采用巧妙的算法搭配合适的数据结构(如布隆过滤器、哈希、位图、堆、数...

海量数据处理 关联式容器

ProMonkey阅读(233)评论(0)赞(0)

关联式容器 一般来说,STL容器分为: 序列式容器(vector/list/deque/stack/queue/heap),和关联式容器。 其中,关联式容器又分为set(集合)和map(映射表)两大类,以及这两大类的衍生体multiset(...

动态规划 本章习题-自猿其说

动态规划 本章习题

ProMonkey阅读(232)评论(0)赞(0)

本章动态规划的习题 1.子序列个数 子序列的定义:对于一个序列a=a[1],a[2],……a[n],则非空序列a’=a[p1],a[p2]……a[pm]为a的一个子序列其中1<=p1<p2<…..<pm<=n。...

动态规划 格子取数-自猿其说

动态规划 格子取数

ProMonkey阅读(276)评论(0)赞(0)

格子取数问题 题目描述 有n*n个格子,每个格子里有正数或者0,从最左上角往最右下角走,只能向下和向右,一共走两次(即从左上角走到右下角走两趟),把所有经过的格子的数加起来,求最大值SUM,且两次如果经过同一个格子,则最后总和SUM中该格子...

动态规划 交替字符串

ProMonkey阅读(224)评论(0)赞(0)

交替字符串 题目描述 输入三个字符串s1、s2和s3,判断第三个字符串s3是否由前两个字符串s1和s2交错而成,即不改变s1和s2中各个字符原有的相对顺序,例如当s1 = “aabcc”,s2 = “dbbca”,s3 = “aadbbcb...

动态规划 字符串编辑距离-自猿其说

动态规划 字符串编辑距离

ProMonkey阅读(253)评论(0)赞(0)

字符串编辑距离 题目描述 给定一个源串和目标串,能够对源串进行如下操作: 在给定位置上插入一个字符 替换任意字符 删除任意字符 写一个程序,返回最小操作数,使得对源串进行这些操作后等于目标串,源串和目标串的长度都小于2000。 分析与解法 ...

聚合实用在线工具

前往在线工具