数据补齐方法有哪些

推荐人：来源: 秒知社阅读: 1.44W 次大中小

数据补齐方法有：人工填写、特殊值填充、平均值填充、热卡填充、K-means填充、回归法、期望值最大化方法、多重填补以及C4.5方法。

数据是事实或观察的结果，是对客观事物的逻辑归纳，是用于表示客观事物的未经加工的原始素材。

数据可以是连续的值，比如声音、图像，称为模拟数据；也可以是离散的，如符号、文字，称为数字数据。

小编还为您整理了以下内容，可能对您也有帮助：

数据补齐方法有：人工填写、特殊值填充、平均值填充、热卡填充、K-means填充、回归法、期望值最大化方法、多重填补以及C4.5方法。

数据是事实或观察的结果，是对客观事物的逻辑归纳，是用于表示客观事物的未经加工的原始素材。

数据可以是连续的值，比如声音、图像，称为模拟数据；也可以是离散的，如符号、文字，称为数字数据。

交通数据补全方法比较新的有哪些

利用人工智能、卫星遥感、社交媒体。

1、基于人工智能的交通数据补全方法。

利用深度学习、神经网络等人工智能技术，对交通数据进行分析和预测，可以补全缺失的交通数据。

2、基于卫星遥感的交通数据补全方法。

利用卫星遥感技术，对交通流量、速度等数据进行监测和分析，从而补全缺失的数据。

3、基于社交媒体的交通数据补全方法。

通过社交媒体上的用户发布的信息和图片，对交通数据进行分析和预测，可以完善缺失的交通数据。

几种常见的缺失数据插补方法

（一）个案剔除法(Listwise Deletion)

最常见、最简单的处理缺失数据的方法是用个案剔除法(listwise

deletion)，也是很多统计软件（如SPSS和SAS）默认的缺失值处理方法。

在这种方法中如果任何一个变量含有缺失数据的话，就把相对应的个案从分析中剔除。

如果缺失值所占比例比较小的话，这一方法十分有效。

至于具体多大的缺失比例算是“小”比例，专家们意见也存在较大的差距。

有学者认为应在5%以下，也有学者认为20%以下即可。

然而，这种方法却有很大的局限性。

它是以减少样本量来换取信息的完备，会造成资源的大量浪费，丢弃了大量隐藏在这些对象中的信息。

在样本量较小的情况下，删除少量对象就足以严重影响到数据的客观性和结果的正确性。

因此，当缺失数据所占比例较大，特别是当缺数据非随机分布时，这种方法可能导致数据发生偏离，从而得出错误的结论。

（二）均值替换法(Mean Imputation)

在变量十分重要而所缺失的数据量又较为庞大的时候，个案剔除法就遇到了困难，因为许多有用的数据也同时被剔除。

围绕着这一问题，研究者尝试了各种各样的办法。

其中的一个方法是均值替换法(mean

imputation)。

我们将变量的属性分为数值型和非数值型来分别进行处理。

如果缺失值是数值型的，就根据该变量在其他所有对象的取值的平均值来填充该缺失的变量值；如果缺失值是非数值型的，就根据统计学中的众数原理，用该变量在其他所有对象的取值次数最多的值来补齐该缺失的变量值。

但这种方法会产生有偏估计，所以并不被推崇。

均值替换法也是一种简便、快速的缺失数据处理方法。

使用均值替换法插补缺失数据，对该变量的均值估计不会产生影响。

但这种方法是建立在完全随机缺失（MCAR）的假设之上的，而且会造成变量的方差和标准差变小。

（三）热卡填充法（Hotdecking）

对于一个包含缺失值的变量，热卡填充法在数据库中找到一个与它最相似的对象，然后用这个相似对象的值来进行填充。

不同的问题可能会选用不同的标准来对相似进行判定。

最常见的是使用相关系数矩阵来确定哪个变量（如变量Y）与缺失值所在变量（如变量X）最相关。

然后把所有个案按Y的取值大小进行排序。

那么变量X的缺失值就可以用排在缺失值前的那个个案的数据来代替了。

与均值替换法相比，利用热卡填充法插补数据后，其变量的标准差与插补前比较接近。

但在回归方程中，使用热卡填充法容易使得回归方程的误差增大，参数估计变得不稳定，而且这种方法使用不便，比较耗时。

（四）回归替换法(Regression Imputation)

回归替换法首先需要选择若干个预测缺失值的自变量，然后建立回归方程估计缺失值，即用缺失数据的条件期望值对缺失值进行替换。

与前述几种插补方法比较，该方法利用了数据库中尽量多的信息，而且一些统计软件（如Stata）也已经能够直接执行该功能。

但该方法也有诸多弊端，第一，这虽然是一个无偏估计，但是却容易忽视随机误差，低估标准差和其他未知性质的测量值，而且这一问题会随着缺失信息的增多而变得更加严重。

第二，研究者必须假设存在缺失值所在的变量与其他变量存在线性关系，很多时候这种关系是不存在的。

（五）多重替代法(Multiple Imputation)

多重估算是由Rubin等人于1987年建立起来的一种数据扩充和统计分析方法，作为简单估算的改进产物。

首先，多重估算技术用一系列可能的值来替换每一个缺失值，以反映被替换的缺失数据的不确定性。

然后，用标准的统计分析过程对多次替换后产生的若干个数据集进行分析。

最后，把来自于各个数据集的统计结果进行综合，得到总体参数的估计值。

由于多重估算技术并不是用单一的值来替换缺失值，而是试图产生缺失值的一个随机样本，这种方法反映出了由于数据缺失而导致的不确定性，能够产生更加有效的统计推断。

结合这种方法，研究者可以比较容易地，在不舍弃任何数据的情况下对缺失数据的未知性质进行推断。

NORM统计软件可以较为简便地操作该方法

excel中如何用插值法补全空白部分数据？

1、打开excel表格，如图。

2、选中表格，如图。

3、按快捷键ctrl+f,选择定位，如图。

4、点击定位下的空值，如图。

5、表格中的空值都被筛选出来，如图。

6、ctrl+f，选择替换，替换为0，如图。

7、表格中空白部分全部填充上0，如图。

excel如何实现单元格数据合并及位数补全？

相信很多小伙伴在日常办公中都会用到Excel表格，在其中如何才能将多个单元格的内容合并到一个单元格中呢？方法很简单，下面小编就来为大家介绍。

具体如下：

1. 首先，在Excel中打开我们要进行操作的表格。

接着，在要合并多个单元格的旁边插入一列空白列并将其选中。

2. 输入一个空格号后，同时按下“Ctrl”+“Enter”键。

3. 接着，选中旁边的单元格，在其中输入“=ph”，然后再双击弹出的“PHONETIC”选项。

4. 然后将我们需要合并内容的单元格和旁边之前做好的辅助列一起都选中，再按下回车键即可合并成功，如下图所示：

5. 最后，将单元格的显示格式根据自身需要进行调整即可。

将这些错误的数据当错缺失数据处理，需要采取一定的手段填充。

缺失的数据采取插值法填充，这一点早就确定下来，但在如何实现上却困扰很久。

将原始问题简化一下。

比如有这样一组数据。

ID so co1

1 0.1 0.1

2 0 0.2

3 0.2 0

4 0 0

5 0 0.4

6 0.1 0.5

插值法计算方法如下：（也可以不使用这两个步骤，只要最后的结果一致就行）

步骤一：计算缺失值上下的已知值间的斜率：

k = (b2 - b1)/(n + 1) n 为缺失数据的个数

步骤二：计算对应的缺失值

a(i) = b1 + k * i

经过处理后，得到的数据是这样的：

1 0.10 0.10

2 0.15 0.20

3 0.20 0.27

4 0.17 0.33

5 0.13 0.40

6 0.10 0.50

我最初的想法是：在sql语句中用for循环来做。

逐条地检查每个数值，如果是0，那么获取它的前一个记录的值b1，然后再继续向后遍历，获取后面一个非0的值b2，计算这两个非0数据之间的距离n，之后再用插值法将缺失的数据计算出来，并update到b1和b2之间的每一个值。

按照这个思路，很麻烦，比如遍历过程中如何获取前一个数值？出现0的时候，如何记录出现多少个0？for循环经过后，再如何update之前的数值？被这些问题困扰很久！

在论坛上发帖解决，解决的办法很受启发。

1. 创建一个函数

ALTER FUNCTION FUN_CO(@ID INT) RETURNS DECIMAL(18, 3) AS BEGIN DECLARE @NUM1 NUMERIC(19,2),@ID1 INT,@NUM2 NUMERIC(19,2),@ID2 INT SELECT TOP 1 @ID1=ID , @NUM1=CO FROM APRECORD WHERE ID<=@ID AND CO<>0 ORDER BY ID DESC SELECT TOP 1 @ID2=ID , @NUM2=CO FROM APRECORD WHERE ID>=@ID AND CO<>0 ORDER BY ID ASC IF @ID2<>@ID1 RETURN @NUM1+(((@NUM2-@NUM1)/(@ID2-@ID1))*(@ID-@ID1)) RETURN @NUM1 END

2. 更新数据库

UPDATE APRECORD SET CO=DBO.FUN_CO(ID) WHERE DAYTIME >= @BDT AND DAYTIME < @EDT

在这个解决方案中，首先查找到缺失的数据，也就是值为0的数据，然后向前查找非0数据@NUM1，以及它的编号@ID1，向后查找非0的数据@NUM2. 以及编号@ID2。

也就是步骤一。

然后用公式计算出填充的数据。

将上述过程保存在一个函数中，在存储过程中调用。

甚至不用for循环之类。

Excel数据补齐

不知道我的问题是否达到您表达的意思，您的问题是希望左边合并单元格的希望变成取消单元格吧？方法如下：选中A列，单击“取消单元格合并”---

1.定位的快捷键：CTRL+G，

2.选择空值。

3.直接输入“=+↑”（在空白单元格输入等于号后点击上面的单元格）

4.Ctrl+Enter

excel表格中,如何补齐数据?

选中＂a"列数据区域，按＂f5＂键＞＂定位条件＂＞＂空值＂＞如图：

＞＂确定＂，如图：

＞输入＂＝＂＞按＂↑＂键＞按＂ctrl＂+＂enter＂健，效果如图：

excel表格中,如何补齐数据?

例,你的这数据在A列

点击A列标签,选定整个A列

右键>设置单元格格式>自定义>0000

确定

数据补齐方法有：人工填写、特殊值填充、平均值填充、热卡填充、K-means填充、回归法、期望值最大化方法、多重填补以及C4.5方法。

数据是事实或观察的结果，是对客观事物的逻辑归纳，是用于表示客观事物的未经加工的原始素材。

数据可以是连续的值，比如声音、图像，称为模拟数据；也可以是离散的，如符号、文字，称为数字数据。

交通数据补全方法比较新的有哪些

利用人工智能、卫星遥感、社交媒体。

1、基于人工智能的交通数据补全方法。

利用深度学习、神经网络等人工智能技术，对交通数据进行分析和预测，可以补全缺失的交通数据。

2、基于卫星遥感的交通数据补全方法。

利用卫星遥感技术，对交通流量、速度等数据进行监测和分析，从而补全缺失的数据。

3、基于社交媒体的交通数据补全方法。

通过社交媒体上的用户发布的信息和图片，对交通数据进行分析和预测，可以完善缺失的交通数据。

几种常见的缺失数据插补方法

（一）个案剔除法(Listwise Deletion)

最常见、最简单的处理缺失数据的方法是用个案剔除法(listwise

deletion)，也是很多统计软件（如SPSS和SAS）默认的缺失值处理方法。

在这种方法中如果任何一个变量含有缺失数据的话，就把相对应的个案从分析中剔除。

如果缺失值所占比例比较小的话，这一方法十分有效。

至于具体多大的缺失比例算是“小”比例，专家们意见也存在较大的差距。

有学者认为应在5%以下，也有学者认为20%以下即可。

然而，这种方法却有很大的局限性。

它是以减少样本量来换取信息的完备，会造成资源的大量浪费，丢弃了大量隐藏在这些对象中的信息。

在样本量较小的情况下，删除少量对象就足以严重影响到数据的客观性和结果的正确性。

因此，当缺失数据所占比例较大，特别是当缺数据非随机分布时，这种方法可能导致数据发生偏离，从而得出错误的结论。

（二）均值替换法(Mean Imputation)

在变量十分重要而所缺失的数据量又较为庞大的时候，个案剔除法就遇到了困难，因为许多有用的数据也同时被剔除。

围绕着这一问题，研究者尝试了各种各样的办法。

其中的一个方法是均值替换法(mean

imputation)。

我们将变量的属性分为数值型和非数值型来分别进行处理。

但这种方法会产生有偏估计，所以并不被推崇。

均值替换法也是一种简便、快速的缺失数据处理方法。

使用均值替换法插补缺失数据，对该变量的均值估计不会产生影响。

但这种方法是建立在完全随机缺失（MCAR）的假设之上的，而且会造成变量的方差和标准差变小。

（三）热卡填充法（Hotdecking）

对于一个包含缺失值的变量，热卡填充法在数据库中找到一个与它最相似的对象，然后用这个相似对象的值来进行填充。

不同的问题可能会选用不同的标准来对相似进行判定。

最常见的是使用相关系数矩阵来确定哪个变量（如变量Y）与缺失值所在变量（如变量X）最相关。

然后把所有个案按Y的取值大小进行排序。

那么变量X的缺失值就可以用排在缺失值前的那个个案的数据来代替了。

与均值替换法相比，利用热卡填充法插补数据后，其变量的标准差与插补前比较接近。

但在回归方程中，使用热卡填充法容易使得回归方程的误差增大，参数估计变得不稳定，而且这种方法使用不便，比较耗时。

（四）回归替换法(Regression Imputation)

回归替换法首先需要选择若干个预测缺失值的自变量，然后建立回归方程估计缺失值，即用缺失数据的条件期望值对缺失值进行替换。

与前述几种插补方法比较，该方法利用了数据库中尽量多的信息，而且一些统计软件（如Stata）也已经能够直接执行该功能。

第二，研究者必须假设存在缺失值所在的变量与其他变量存在线性关系，很多时候这种关系是不存在的。

（五）多重替代法(Multiple Imputation)

多重估算是由Rubin等人于1987年建立起来的一种数据扩充和统计分析方法，作为简单估算的改进产物。

首先，多重估算技术用一系列可能的值来替换每一个缺失值，以反映被替换的缺失数据的不确定性。

然后，用标准的统计分析过程对多次替换后产生的若干个数据集进行分析。

最后，把来自于各个数据集的统计结果进行综合，得到总体参数的估计值。

结合这种方法，研究者可以比较容易地，在不舍弃任何数据的情况下对缺失数据的未知性质进行推断。

NORM统计软件可以较为简便地操作该方法

excel中如何用插值法补全空白部分数据？

1、打开excel表格，如图。

2、选中表格，如图。

3、按快捷键ctrl+f,选择定位，如图。

4、点击定位下的空值，如图。

5、表格中的空值都被筛选出来，如图。

6、ctrl+f，选择替换，替换为0，如图。

7、表格中空白部分全部填充上0，如图。

excel如何实现单元格数据合并及位数补全？

相信很多小伙伴在日常办公中都会用到Excel表格，在其中如何才能将多个单元格的内容合并到一个单元格中呢？方法很简单，下面小编就来为大家介绍。

具体如下：

1. 首先，在Excel中打开我们要进行操作的表格。

接着，在要合并多个单元格的旁边插入一列空白列并将其选中。

2. 输入一个空格号后，同时按下“Ctrl”+“Enter”键。

3. 接着，选中旁边的单元格，在其中输入“=ph”，然后再双击弹出的“PHONETIC”选项。

4. 然后将我们需要合并内容的单元格和旁边之前做好的辅助列一起都选中，再按下回车键即可合并成功，如下图所示：

5. 最后，将单元格的显示格式根据自身需要进行调整即可。

将这些错误的数据当错缺失数据处理，需要采取一定的手段填充。

缺失的数据采取插值法填充，这一点早就确定下来，但在如何实现上却困扰很久。

将原始问题简化一下。

比如有这样一组数据。

ID so co1

1 0.1 0.1

2 0 0.2

3 0.2 0

4 0 0

5 0 0.4

6 0.1 0.5

插值法计算方法如下：（也可以不使用这两个步骤，只要最后的结果一致就行）

步骤一：计算缺失值上下的已知值间的斜率：

k = (b2 - b1)/(n + 1) n 为缺失数据的个数

步骤二：计算对应的缺失值

a(i) = b1 + k * i

经过处理后，得到的数据是这样的：

1 0.10 0.10

2 0.15 0.20

3 0.20 0.27

4 0.17 0.33

5 0.13 0.40

6 0.10 0.50

我最初的想法是：在sql语句中用for循环来做。

在论坛上发帖解决，解决的办法很受启发。

1. 创建一个函数

2. 更新数据库

UPDATE APRECORD SET CO=DBO.FUN_CO(ID) WHERE DAYTIME >= @BDT AND DAYTIME < @EDT

在这个解决方案中，首先查找到缺失的数据，也就是值为0的数据，然后向前查找非0数据@NUM1，以及它的编号@ID1，向后查找非0的数据@NUM2. 以及编号@ID2。

也就是步骤一。

然后用公式计算出填充的数据。

将上述过程保存在一个函数中，在存储过程中调用。

甚至不用for循环之类。

Excel数据补齐

不知道我的问题是否达到您表达的意思，您的问题是希望左边合并单元格的希望变成取消单元格吧？方法如下：选中A列，单击“取消单元格合并”---

1.定位的快捷键：CTRL+G，

2.选择空值。

3.直接输入“=+↑”（在空白单元格输入等于号后点击上面的单元格）

4.Ctrl+Enter

excel表格中,如何补齐数据?

选中＂a"列数据区域，按＂f5＂键＞＂定位条件＂＞＂空值＂＞如图：

＞＂确定＂，如图：

＞输入＂＝＂＞按＂↑＂键＞按＂ctrl＂+＂enter＂健，效果如图：

excel表格中,如何补齐数据?

例,你的这数据在A列

点击A列标签,选定整个A列

右键>设置单元格格式>自定义>0000

确定

数据补齐方法有：人工填写、特殊值填充、平均值填充、热卡填充、K-means填充、回归法、期望值最大化方法、多重填补以及C4.5方法。

数据是事实或观察的结果，是对客观事物的逻辑归纳，是用于表示客观事物的未经加工的原始素材。

数据可以是连续的值，比如声音、图像，称为模拟数据；也可以是离散的，如符号、文字，称为数字数据。

交通数据补全方法比较新的有哪些

利用人工智能、卫星遥感、社交媒体。

1、基于人工智能的交通数据补全方法。利用深度学习、神经网络等人工智能技术，对交通数据进行分析和预测，可以补全缺失的交通数据。

2、基于卫星遥感的交通数据补全方法。利用卫星遥感技术，对交通流量、速度等数据进行监测和分析，从而补全缺失的数据。

3、基于社交媒体的交通数据补全方法。通过社交媒体上的用户发布的信息和图片，对交通数据进行分析和预测，可以完善缺失的交通数据。

几种常见的缺失数据插补方法

（一）个案剔除法(Listwise Deletion)

最常见、最简单的处理缺失数据的方法是用个案剔除法(listwise

deletion)，也是很多统计软件（如SPSS和SAS）默认的缺失值处理方法。在这种方法中如果任何一个变量含有缺失数据的话，就把相对应的个案从分析中剔除。如果缺失值所占比例比较小的话，这一方法十分有效。至于具体多大的缺失比例算是“小”比例，专家们意见也存在较大的差距。有学者认为应在5%以下，也有学者认为20%以下即可。然而，这种方法却有很大的局限性。它是以减少样本量来换取信息的完备，会造成资源的大量浪费，丢弃了大量隐藏在这些对象中的信息。在样本量较小的情况下，删除少量对象就足以严重影响到数据的客观性和结果的正确性。因此，当缺失数据所占比例较大，特别是当缺数据非随机分布时，这种方法可能导致数据发生偏离，从而得出错误的结论。

（二）均值替换法(Mean Imputation)

在变量十分重要而所缺失的数据量又较为庞大的时候，个案剔除法就遇到了困难，因为许多有用的数据也同时被剔除。围绕着这一问题，研究者尝试了各种各样的办法。其中的一个方法是均值替换法(mean

imputation)。我们将变量的属性分为数值型和非数值型来分别进行处理。如果缺失值是数值型的，就根据该变量在其他所有对象的取值的平均值来填充该缺失的变量值；如果缺失值是非数值型的，就根据统计学中的众数原理，用该变量在其他所有对象的取值次数最多的值来补齐该缺失的变量值。但这种方法会产生有偏估计，所以并不被推崇。均值替换法也是一种简便、快速的缺失数据处理方法。使用均值替换法插补缺失数据，对该变量的均值估计不会产生影响。但这种方法是建立在完全随机缺失（MCAR）的假设之上的，而且会造成变量的方差和标准差变小。

（三）热卡填充法（Hotdecking）

对于一个包含缺失值的变量，热卡填充法在数据库中找到一个与它最相似的对象，然后用这个相似对象的值来进行填充。不同的问题可能会选用不同的标准来对相似进行判定。最常见的是使用相关系数矩阵来确定哪个变量（如变量Y）与缺失值所在变量（如变量X）最相关。然后把所有个案按Y的取值大小进行排序。那么变量X的缺失值就可以用排在缺失值前的那个个案的数据来代替了。与均值替换法相比，利用热卡填充法插补数据后，其变量的标准差与插补前比较接近。但在回归方程中，使用热卡填充法容易使得回归方程的误差增大，参数估计变得不稳定，而且这种方法使用不便，比较耗时。

（四）回归替换法(Regression Imputation)

回归替换法首先需要选择若干个预测缺失值的自变量，然后建立回归方程估计缺失值，即用缺失数据的条件期望值对缺失值进行替换。与前述几种插补方法比较，该方法利用了数据库中尽量多的信息，而且一些统计软件（如Stata）也已经能够直接执行该功能。但该方法也有诸多弊端，第一，这虽然是一个无偏估计，但是却容易忽视随机误差，低估标准差和其他未知性质的测量值，而且这一问题会随着缺失信息的增多而变得更加严重。第二，研究者必须假设存在缺失值所在的变量与其他变量存在线性关系，很多时候这种关系是不存在的。

（五）多重替代法(Multiple Imputation)

多重估算是由Rubin等人于1987年建立起来的一种数据扩充和统计分析方法，作为简单估算的改进产物。首先，多重估算技术用一系列可能的值来替换每一个缺失值，以反映被替换的缺失数据的不确定性。然后，用标准的统计分析过程对多次替换后产生的若干个数据集进行分析。最后，把来自于各个数据集的统计结果进行综合，得到总体参数的估计值。由于多重估算技术并不是用单一的值来替换缺失值，而是试图产生缺失值的一个随机样本，这种方法反映出了由于数据缺失而导致的不确定性，能够产生更加有效的统计推断。结合这种方法，研究者可以比较容易地，在不舍弃任何数据的情况下对缺失数据的未知性质进行推断。NORM统计软件可以较为简便地操作该方法

excel中如何用插值法补全空白部分数据？

1、打开excel表格，如图。

2、选中表格，如图。

3、按快捷键ctrl+f,选择定位，如图。

4、点击定位下的空值，如图。

5、表格中的空值都被筛选出来，如图。

6、ctrl+f，选择替换，替换为0，如图。

7、表格中空白部分全部填充上0，如图。

excel如何实现单元格数据合并及位数补全？

相信很多小伙伴在日常办公中都会用到Excel表格，在其中如何才能将多个单元格的内容合并到一个单元格中呢？方法很简单，下面小编就来为大家介绍。

具体如下：

1. 首先，在Excel中打开我们要进行操作的表格。接着，在要合并多个单元格的旁边插入一列空白列并将其选中。

2. 输入一个空格号后，同时按下“Ctrl”+“Enter”键。

3. 接着，选中旁边的单元格，在其中输入“=ph”，然后再双击弹出的“PHONETIC”选项。

4. 然后将我们需要合并内容的单元格和旁边之前做好的辅助列一起都选中，再按下回车键即可合并成功，如下图所示：

5. 最后，将单元格的显示格式根据自身需要进行调整即可。

2、我们在菜单栏依次点击“转换”、“替换缺失值”。

3、之后会弹出“替换缺失值”对话框。我们将生物字段点选入右侧选框。可以根据个人需要重新命名名称。

4、之后在查看器中可以看到对于缺失值的描述及处理方法。

5、返回SPSS主界面，可以看到新增的一列数据，对于缺失值已经进行了补充。

excel 缺失数据如何补齐

在A1输入：

=MOD(ROW(A1)-1,24)+1

下拉；

B1公式：

=IFERROR(INDEX(E$3:E$1000,SMALL(IF($D$3:$D$1000=A1,ROW($1:$998),9^9),COUNTIF($A$1:$A1,$A1))),"")

数组公式，需要按CTRL+SHIFT+回车完成公式，右拉到C1，下拉。追问我这个24小时序列是正好是一年的，按您的方法做了，B序列下拉，过了3000行后数据就没有了，是不是您设置了上限什么的？

追答B1公式：

=IFERROR(INDEX(E$3:E$5000,SMALL(IF($D$3:$D$5000=A1,ROW($1:$4998),9^9),COUNTIF($A$1:$A1,$A1))),"")

数组公式，需要按CTRL+SHIFT+回车完成公式，右拉到C1，下拉。

股价数据缺失，用什么插值法补齐较好？

meigushe888：

将这些错误的数据当错缺失数据处理，需要采取一定的手段填充。缺失的数据采取插值法填充，这一点早就确定下来，但在如何实现上却困扰很久。

将原始问题简化一下。比如有这样一组数据。

ID so co1

1 0.1 0.1

2 0 0.2

3 0.2 0

4 0 0

5 0 0.4

6 0.1 0.5

插值法计算方法如下：（也可以不使用这两个步骤，只要最后的结果一致就行）

步骤一：计算缺失值上下的已知值间的斜率：

k = (b2 - b1)/(n + 1) n 为缺失数据的个数

步骤二：计算对应的缺失值

a(i) = b1 + k * i

经过处理后，得到的数据是这样的：

1 0.10 0.10

2 0.15 0.20

3 0.20 0.27

4 0.17 0.33

5 0.13 0.40

6 0.10 0.50

我最初的想法是：在sql语句中用for循环来做。逐条地检查每个数值，如果是0，那么获取它的前一个记录的值b1，然后再继续向后遍历，获取后面一个非0的值b2，计算这两个非0数据之间的距离n，之后再用插值法将缺失的数据计算出来，并update到b1和b2之间的每一个值。按照这个思路，很麻烦，比如遍历过程中如何获取前一个数值？出现0的时候，如何记录出现多少个0？for循环经过后，再如何update之前的数值？被这些问题困扰很久！

在论坛上发帖解决，解决的办法很受启发。

1. 创建一个函数

2. 更新数据库

UPDATE APRECORD SET CO=DBO.FUN_CO(ID) WHERE DAYTIME >= @BDT AND DAYTIME < @EDT

在这个解决方案中，首先查找到缺失的数据，也就是值为0的数据，然后向前查找非0数据@NUM1，以及它的编号@ID1，向后查找非0的数据@NUM2. 以及编号@ID2。也就是步骤一。然后用公式计算出填充的数据。将上述过程保存在一个函数中，在存储过程中调用。甚至不用for循环之类。

Excel数据补齐

不知道我的问题是否达到您表达的意思，您的问题是希望左边合并单元格的希望变成取消单元格吧？方法如下：选中A列，单击“取消单元格合并”---

1.定位的快捷键：CTRL+G，

2.选择空值。

3.直接输入“=+↑”（在空白单元格输入等于号后点击上面的单元格）

4.Ctrl+Enter

excel表格中,如何补齐数据?