解决Excel文件流读取数字为时间乱码问题
在将Excel文件流转换为Java中的List时,如果遇到文本被错误地识别为日期格式的问题,这通常是由于Apache POI库在处理单元格数据时默认的行为所导致的。Apache POI会尝试根据单元格的内容自动确定其类型,包括字符串、数字(可能解释为日期)、布尔值等。
为了解决这个问题,你可以在读取单元格数据时更明确地指定如何处理数字类型的单元格,特别是当你知道某些单元格应该被当作纯文本处理时。
使用DataFormatter:
DataFormatter类是一个有用的工具,它可以根据Excel中的格式设置将单元格内容转换为字符串。这可以帮助你避免类型识别的问题,因为DataFormatter会尽量保留单元格在Excel中的显示格式。
import org.apache.poi.ss.usermodel.*;
import org.apache.poi.xssf.usermodel.XSSFWorkbook;
import org.apache.poi.ss.usermodel.DataFormatter;
List<List<String>> olist2 = new ArrayList<>();
Workbook workbook = new XSSFWorkbook(file.getInputStream());
DataFormatter dataFormatter = new DataFormatter();
for (Row row : workbook.getSheetAt(0)) {
if(row.getRowNum() == 0){
continue;
}
List<String> data = new ArrayList<>();
for (Cell cell : row) {
String cellData = dataFormatter.formatCellValue(cell);
data.add(cellData);
}
olist2.add(data);
}