信息发布软件,b2b软件,广告发布软件
标题: 浅谈Java读取Csv实践和多方法实例教程演示 [打印本页]
作者: 宣传工具 时间: 2016-9-27 14:15
标题: 浅谈Java读取Csv实践和多方法实例教程演示
在CSV中,数据的字段由逗号分开,程序通过读取文件重新创建正确的字段,方法是每次遇到逗号时开始新一段数据。CSV文件是一个计算机数据文件用于执行审判和真正的组织工具,逗号分隔的清单。CSV文件是用于数字存储的数据结构表的形式列出,每个相关的项目(会员)的一组是与他人也由逗号隔开的规定。中的每一行都CSV文件对应表中的行。在一条线,字段用逗号分隔,每一个领域属于一个表列。CSV文件常常被用于移动表格数据之间的两个不同的计算机程序,例如关系数据库程序和电子表格程序。让我们一起来探讨Java是怎样读取CSV的??
看项目中以前的处理方式是直接用用java IO类库读取Csv文件,实际处理中发现Csv文件本身包含了对各种特殊字符的处理信息。最常见的比如:
1. 对包含特殊字符的字符串数据首尾加双引号
2. 对数据中的单个双引号前加单个双引号
其它...
所以用Java IO读到的字符串全是经过处理后的字符串,在某些场景下是不符合预期需求的。比如我需要的是不做任何处理的原始内容。
项目中另一种常见的文件格式Excel用了POI来处理,但是POI不支持Csv格式,于是找到了javacsv。
代码很简单:
Java代码
public List importCsv(String file) { List list = new ArrayList(); CsvReader reader = null; try { //初始化CsvReader并指定列分隔符和字符编码 reader = new CsvReader(file, ',', Charset.forName("GBK")); while (reader.readRecord()) { //读取每行数据以数组形式返回 String[] str = reader.getValues(); if (str != null && str.length > 0) { if (str[0] != null && !"".equals(str[0].trim())) { list.add(str); } } } } catch (FileNotFoundException e) { log.error("Error reading csv file.",e); } catch (IOException e) { log.error("",e); } finally { if(reader != null) //关闭CsvReader reader.close(); } return list; } |
以上代码有几个要点:
1、初始化CsvReader时指定分隔符和字符编码,如果不指定,默认分别为逗号和ISO-8859-1,我用了GBK,具体使用时要看当时的字符编码而定。
2、读取每行数据,返回字符串数组,数组内的顺序即文件数据列的顺序
3、最后记得关闭CsvReader
是不是很简单,返回的数组格式也正好是我想要的,而且拿到是原始的数据,没有经过特殊字符处理。
有些同学质疑特殊字符未经处理,插到数据库会出错,其实大可不必我们手工处理,一些基础组件比如JDBC的preparedstatement已经包含了对特殊字符的处理,我们只要以绑定参数的形式来传送这些包含特殊字符的数据就可以。常用的持久化框架底层也封装了JDBC,自然也对特殊字符做了处理。
作者: 宣传工具 时间: 2016-9-27 14:16
实例教程2
逗号分隔型取值格式(英文全称为Comma Separated Values,简称CSV),是一种纯文本格式,用来存储数据。在CSV中,数据的字段由逗号分开,程序通过读取文件重新创建正确的字段,方法是每次遇到逗号时开始新一段数据。
CSV文件是一个计算机数据文件用于执行审判和真正的组织工具,逗号分隔的清单。常常被用于移动表格数据之间的两个不同的计算机程序,例如关系数据库程序和电子表格程序。
本文以下面这个CSV文件为例,向大家简要介绍Java语言的CSV读写操作的一种实现方法。
writers.csv
张艺谋,1951,1114
小沈阳,1981,0507
孙红雷,1970,0816
闫妮,1971,0310
CSV读取操作
CSV文件读取主要用到java.io.BufferedReader类和java.util.StringTokenizer类,BufferedReader用来读入文件,StringTokenizer用来将一行数据分成多个字段。
下面是用来读取CSV文件内容的类:
package tip;
import java.io.BufferedReader;
import java.io.File;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.IOException;
import java.util.StringTokenizer;
public class ReadCSV {
public static void main(String[] args) {
try {
File csv = new File("C:\\writers.csv"); // CSV文件
BufferedReader br = new BufferedReader(new FileReader(csv));
// 读取直到最后一行
String line = "";
while ((line = br.readLine()) != null) {
// 把一行数据分割成多个字段
StringTokenizer st = new StringTokenizer(line, ",");
while (st.hasMoreTokens()) {
// 每一行的多个字段用TAB隔开表示
System.out.print(st.nextToken() + "\t");
}
System.out.println();
}
br.close();
} catch (FileNotFoundException e) {
// 捕获File对象生成时的异常
e.printStackTrace();
} catch (IOException e) {
// 捕获BufferedReader对象关闭时的异常
e.printStackTrace();
}
}
}
执行结果如下所示:
CSV写操作
CSV文件读取主要用到java.io.BufferedWriter类。
下面是写CSV文件的类:
package tip;
import java.io.BufferedWriter;
import java.io.File;
import java.io.FileNotFoundException;
import java.io.FileWriter;
import java.io.IOException;
public class WriteCSV {
public static void main(String[] args) {
try {
File csv = new File("C:\\writers.csv"); // CSV文件
// 追记模式
BufferedWriter bw = new BufferedWriter(new FileWriter(csv, true));
// 新增一行数据
bw.newLine();
bw.write("三枪拍案惊奇" + "," + "2009" + "," + "1212");
bw.close();
} catch (FileNotFoundException e) {
// 捕获File对象生成时的异常
e.printStackTrace();
} catch (IOException e) {
// 捕获BufferedWriter对象关闭时的异常
e.printStackTrace();
}
}
}
执行之后的writers.csv文件如下所示:
张艺谋,1951,1114
小沈阳,1981,0507
孙红雷,1970,0816
闫妮,1971,0310
三枪拍案惊奇,2009,1212
欢迎光临 信息发布软件,b2b软件,广告发布软件 (http://postbbs.com/) |
Powered by Discuz! X3.2 |