先看一下定义
稀疏矩阵:在矩阵中,若数值为0的元素数目远远多于非0元素的数目,并且非0元素分布没有规律时,则称该矩阵为稀疏矩阵;与之相反,若非0元素数目占大多数时,则称该矩阵为稠密矩阵。定义非零元素的总数比上矩阵所有元素的总数为矩阵的稠密度。
这是线性代数中的内容,对应到咱们写代码上,其实就是一个二维数组,但如果使用二维数组存储这种类型的数据,很明显发现占用了很多无效的存储空间,反而存储了较少有效的数据。于是乎,使用稀疏数组存储这些内容的方法实现了,可以大大节省存储空间。
先看一个简单的例子,下面再分享代码:
比如有这样一个二维数组:
存储了16个值,但真正有用的就两个值,那么有没有办法只把有效的值存起来,其他冗余的就给一个默认值,这种存储方式就是稀疏数组。
先看存起来是啥样子( 行数:有效数据个数 + 1,列数:3列,其余值默认为0)
不得不佩服人家的思想,这境界!!!
下面用代码来实现一个现实的案例:
我在下围棋时,下到了这样一个局面,临时有事,我想把它保存下来,下次有空的时候再下,这样怎么保存呢。
两种方法,一种用二维数组保存,一种用稀疏数组保存,两种都实现一下,最后对比一下存储的大小。
java">import java.io.BufferedWriter;
import java.io.FileWriter;
import java.io.IOException;
public class 稀疏数组 {
public static void main(String[] args) throws IOException {
// 创建一个原始的二维数组 13 * 13
// 0: 表示没有棋子, 1 表示黑子 2 表示白子
int chessArr1[][] = new int[13][13];
chessArr1[2][5] = 1;
chessArr1[3][10] = 1;
chessArr1[4][9] = 1;
chessArr1[9][3] = 1;
chessArr1[2][8] = 2;
chessArr1[3][3] = 2;
chessArr1[7][2] = 2;
chessArr1[10][5] = 2;
// 输出原始的二维数组
System.out.println("原始的二维数组--------------->");
//写到文件里
FileWriter osw = new FileWriter("D:\\360MoveData\\Users\\Administrator\\Desktop\\原始二维数组.txt");
BufferedWriter bw = new BufferedWriter(osw);
for (int[] row : chessArr1) {
for (int data : row) {
bw.write(data + " ");
System.out.printf("%d\t", data);
}
bw.newLine();
System.out.println();
}
//关闭流
bw.flush();
bw.close();
osw.close();
// 将二维数组 转 稀疏数组的思
// 1. 先遍历二维数组 得到非0数据的个数
int sum = 0;
for (int i = 0; i < 13; i++) {
for (int j = 0; j < 13; j++) {
if (chessArr1[i][j] != 0) {
sum++;
}
}
}
// 2. 创建对应的稀疏数组
int sparseArr[][] = new int[sum + 1][3];
// 给稀疏数组赋值
sparseArr[0][0] = 13;
sparseArr[0][1] = 13;
sparseArr[0][2] = sum;
// 遍历二维数组,将非0的值存放到 sparseArr中
int count = 0; //count 用于记录是第几个非0数据
for (int i = 0; i < 13; i++) {
for (int j = 0; j < 13; j++) {
if (chessArr1[i][j] != 0) {
count++;
sparseArr[count][0] = i;
sparseArr[count][1] = j;
sparseArr[count][2] = chessArr1[i][j];
}
}
}
// 输出稀疏数组的形式
System.out.println("-------------------------------------------------------");
System.out.println("生成的稀疏数组---------------------->");
FileWriter fileWriter = new FileWriter("D:\\360MoveData\\Users\\Administrator\\Desktop\\稀疏数组.txt");
BufferedWriter bufferedWriter = new BufferedWriter(fileWriter);
for (int i = 0; i < sparseArr.length; i++) {
bufferedWriter.write(sparseArr[i][0] + " " + sparseArr[i][1] + " " + sparseArr[i][2]);
bufferedWriter.newLine();
System.out.printf("%d\t%d\t%d\t\n", sparseArr[i][0], sparseArr[i][1], sparseArr[i][2]);
}
bufferedWriter.close();
fileWriter.close();
//将稀疏数组 ----> 恢复成原始的二维数组
/*
* 1. 先读取稀疏数组的第一行,根据第一行的数据,创建原始的二维数组,比如上面的 chessArr2 = int [11][11]
2. 在读取稀疏数组后几行的数据,并赋给 原始的二维数组 即可.
*/
//1. 先读取稀疏数组的第一行,根据第一行的数据,创建原始的二维数组
int chessArr2[][] = new int[sparseArr[0][0]][sparseArr[0][1]];
//2. 在读取稀疏数组后几行的数据(从第二行开始),并赋给 原始的二维数组 即可
for(int i = 1; i < sparseArr.length; i++) {
chessArr2[sparseArr[i][0]][sparseArr[i][1]] = sparseArr[i][2];
}
// 输出恢复后的二维数组
System.out.println();
System.out.println("恢复后的二维数组");
for (int[] row : chessArr2) {
for (int data : row) {
System.out.printf("%d\t", data);
}
System.out.println();
}
}
}
代码运行一下,看一下控制台:
再看一下存储的文件:
节省空间的效果的还是很明显的,也许有人会说占用的空间一样大,这是因为文件本身就太小,和磁盘存储的簇大小有关,最小就是4096个字节,你如果使用海量数据试一下,就有明显区别了
那是不是永远都是使用稀疏数组节省空间呢,显然不是的,这就和最上面提到的稠密度有关了,
通常认为矩阵中非零元素的总数比上矩阵所有元素总数的值小于等于0.05时,则称该矩阵为稀疏矩阵(sparse matrix),该比值称为这个矩阵的稠密度,那么这时候就相对应使用稀疏数组为较优方案