开发者

Java操作Excel的示例详解

开发者 https://www.devze.com 2023-01-11 10:19 出处:网络 作者: 糊涂涂是个小盆友
目录使用场景excel 03 和 07的区别POIeasyExcel解析excel表中的对象POI使用步骤POI 写数据POI 读数据计算公式easyExcel读写数据写数据读数据Java操作Excel数据
目录
  • 使用场景
  • excel 03 和 07的区别
  • POI
  • easyExcel
  • 解析excel表中的对象
  • POI使用步骤
  • POI 写数据
  • POI 读数据
  • 计算公式
  • easyExcel读写数据
    • 写数据
  • 读数据

    Java操作Excel数据

    在 平时 可以使用IO流对Excle进行操作

    但是现在使用更加方便的第三方组件来实现

    使用场景

    1、将用户信息导出为Excel表格,导入数据

    2、将Excel表中的数据录入到网站数据库 (习题上传) 减轻网站的录入量

    3、开发中经常会设计到Excel的处理,导入Excel到数据库中

    目前最流行的是 Apache POI以及阿里巴巴easyExcel

    excel 03 和 07的区别

    HSSF 对应excel中的03版本 该版本要求excel中最多只能写65536行

    后缀名为 03.xls

    XSSF 对应excel中的07版本 该版本对于行数没有要求

    后缀名为 07.xlsx

    POI

    Apache提供的,会比较麻烦,比较原生

    开放源码函式库,POI提供API给java程序对Office格式档案读和写的功能

    但是存在内存问题 => POI将数据会先写入内存中,一旦写入的内容过多时会产生OOM,也叫做内存溢出

    easyExcel

    https://github.com/alibaba/easyexcel

    对POI进行了一些优化,可以使开发者更加简单,读和写代码只需要1行

    存在时间的问题 => easyExcel在写数据时是一行一行往磁盘中写,所以解决了POI的内存问题,但是带来了时间问题

    Java操作Excel的示例详解

    解析excel表中的对象

    由于java中万物皆对象,所以需要先观察一张excel表中有哪些对象~

    Java操作Excel的示例详解

    1、工作簿

    2、工作表

    3、行

    4、列 => 单元格

    POI使用步骤

    第一步:创建Maven项目

    第二步:导入依赖

    <dependencies>
            <!-- xls 03-->
            <dependency>
                <groupId>org.apache.poi</groupId>
                <artifactId>poi</artifactId>
                <version>3.9</version>
            </dependency>
            <!-- xlsx 07-->
            <dependency>
                <groupId>org.apache.poi</groupId>
                <artifactId>poi-ooXML</artifactId>
                <version>3.9</version>
            </dependency>
            <!-- 日期格式化工具-->
            <dependency>
                <groupId>joda-time</groupId>
                <artifactId>joda-time</artifactId>
                <version>2.10.1</version>
            </dependency>
            <!--测试-->
            <dependency>
                <groupId>junit</groupId>
                <artifactId>junit</artifactId>
                <version>4.12</version>
                <scope>test</scope>
            </dependency>
    </dependencies>
    

    POI 写数据

    第一步:基本文件的写入

    Java操作Excel的示例详解

    private String PATH = "E:\\JavaCode\\Maven\\excel-demo\\src";
    

    03版本测试

    @Test
        public void test03() throws Exception {
            // 1 创建工作簿
            Workbook workbook = new HSSFWorkpythonbook();
            // 2 创建工作表
            Sheet sheet1 = workbook.createSheet("表1");
            // 3 创建行  下标从0开始  第一行
            Row row1 = sheet1.createRow(0);
    
            // 4 创建单元格 (1,1)
            Cell cell1 = row1.createCell(0);
            // 5 往第一个单元格填入数据
            cell1.setCellValue("今日新加入");
            // 6 创建第二个单元格(1,2)
            Cell cell2 = row1.createCell(1);
            cell2.setCellValue("统计时间");
    
            // 创建第二行
            Row row2 = sheet1.createRow(1);
            // (2,1)
            Cell cell3 = row2.createCell(0);
            cell3.setCellValue("11000");
            // (2,2)
            Cell cell4 = row2.createCell(1);
            cell4.setCellValue(new DateTime().toString("yyyy-MM-dd hh:mm:ss"));
    
            // 生成表的IO流 03
            FileOutputStream fos = new FileOutputStream(PATH + "03版本excel.xls");
            // 将工作簿写入
            workbook.write(fos);
    
            // 释放流
            fos.close();
            System.out.println("创建成功");
    
        }

    07版本测试

     @Test
        public void test07() throws Exception {
            // 1 创建工作簿
            Workbook workbook = new SXSSFWorkbook();    //todo
            // 2 创建工作表
            Sheet sheet1 = workbook.createSheet("表1");
            // 3 创建行  下标从0开始  第一行
            Row row1 = sheet1.createRow(0);
    
            // 4 创建单元格 (1,1)
            Cell cell1 = row1.createCell(0);
            // 5 往第一个单元格填入数据
            cell1.setCellValue("今日新加入");
            // 6 创建第二个单元格(1,2)
            Cell cell2 = row1.createCell(1);
            cell2.setCellValue("统计时间");
    
            // 创建第二行
            Row row2 = sheet1.createRow(1);
            // (2,1)
            Cell cell3 = row2.createCell(0);
            cell3.setCellValue("11000");
            // (2,2)
            Cell cell4 = row2.createCell(1);
            cell4.setCellValue(new DateTime().toString("yyyy-MM-dd hh:mm:ss"));
    
            // 生成表的IO流 03
            FileOutputStream fos = new FileOutputStream(PATH + "07版本excel.xlsx");
            // 将工作簿写入
            workbook.write(fo开发者_C入门s);
    
            // 释放流
            fos.close();
            System.out.println("创建成功");
    
        }
    

    第二步:大数据写入

    HSSF 写入

    缺点:最多只能处理65536行数据,否则会抛出异常 java.lang.IllegalArgumentException

    优点:过程中写入缓存,不操作磁盘,最后一次性写入磁盘,速度快

    //    03 版本  多数据写入
        @Test
        public void test03BigData() throws Exception {
            long start = System.currentTimeMillis();
    
            Workbook workbook = new HSSFWorkbook();
            Sheet s1 = workbook.createSheet("表1");
    
            for (int row = 0; row < 65536; row++) {
                Row rows = s1.createRow(row);
                for (int cell = 0; cell < 10; cell++) {
                    Cell cells = rows.createCell(cell);
                    cells.setCellValue(cell);
                }
            }
            FileOutputStream fos = new FileOutputStream(PATH + "03BigData.xls");
            workbook.write(fos);
            fos.close();
    
            long end = System.currentTimeMillis();
            System.out.println("总耗时:" + (double) (end - start) / 1000 + "秒");
        }
    

    XSSF 写入

    缺点:写数据使速度非常慢,非常耗费内存,也会发生内存溢出 ,如写100万条数据

    优点:可以写比HSSF大的数据量,如20万条数据

    //    07 版本 低性能  XSSF
        @Test
        public void test07BigData() throws Exception {
            long start = System.currentTimeMillis();
    
            Workbook workbook = new XSSFWorkbook();
            Sheet s1 = workbook.createSheet("表1");
    
            for (int row = 0; row < 65536; row++) {
                Row rows = s1.createRow(row);
                for (int cell = 0; cell < 10; cell++) {
                    Cell cells = rows.createCell(cell);
                    cells.setCellValue(cell);
                }
            }
            FileOutputStream fos = new FileOutputStream(PATH + "07BigData-XSSF.xlsx");
            workbook.write(fos);
            fos.close();
    
            long end = System.currentTimeMillis();
            System.out.println("总耗时:" + (double) (end - start) / 1000 + "秒");
        }
    

    SXSSF 写入

    优点:可以写非常大的数据量,如100万条,写的速度也非常快,占用更少的内存

    SXSSFWorkbook-来至官方的解释∶实现"BigGridDemo"策略的流式XSSFWorkbook版本。这允许写入非常大的文件而不会耗尽内存,因为任何时候只有可配置的行部分被保存在内存中。

    请注意,仍然可能会消耗大量内存,这些内存基于您正在使用的功能,例如合并区域,注.…….然只存储在内存中,因此如果广泛使用,可能需要大量内存。 可以使用jprofile来监控

    注意

    过程中会产生临时文件,需要清理临时文件

    默认由100条记录被保存到内存中,如果超过这个数量,则最前面的数据就被写入临时文件,如果想自定义内存中数据的数量,可以使用 new SXSSFWorkbook(数量)

     //    07 版本 高性能  SXSS   性能优化
        @Test
        public void test07BigData2() throws Exception {
            long start = System.currentTimeMillis();
    
            Workbook workbook = new SXSSFWorkbook();
            Sheet s1 = workbook.createSheet("表1");
    
            for (int row = 0; row < 65536; row++) {
                Row rows = s1.createRow(row);
                for (int cell = 0; cell < 10; cell++) {
                    Cell cells = rows.createCell(cell);
                    cells.setCellValue(cell);
                }
            }
            FileOutputStream fos = new FileOutputStream(PATH + "07BigData-SXSS.xlsx");
            workbook.write(fos);
            fos.close();
    
            // todo 清除临时文件 需要强转类型
            ((SXSSFWorkbook) workbook).dispose();
    
            long end = System.currentTimeMillis();
            System.out.println("总耗时:" + (double) (end - start) / 1000 + "秒");
        }
    

    POI 读数据

    在读取excel表格中单元格中的数据的时候,需要注意一点的是:单元格中的数据可以有String类型、Number类型、Date类型等,所以需要通过Switch-case来进行判断获取,否则会报错

    private String PATH = "E:\\JavaCode\\Maven\\excel-demo\\src";
    

    不用清除临时文件

    HSSF 读数据

    @Test
        public void Read03() throws Exception {
            // 0、得到文件输入流
            FileInputStream fis = new FileInputStream(PATH + "03版本excel.xls");
            // 1、工作簿
            Workbook workbook = new HSSFWorkbook(fis);
            // 2.得到表   可以根据索引也可以根据表的名称
            Sheet sheet = workbook.getSheetAt(0);
            // 3、得到行
            Row row = sheet.getRow(1);
            // 4、得到列   锁定单元格
            Cell cell = row.getCell(0);
            // 5、根据类型得到单元格中的内容
            String value = cell.getStringCellValue();
    
            System.out.println(value);
        }

    XSSF 读数据

    @Test
        public void Read07() throws Exception {
            // 0、得到文件输入流
            FileInputStream fis = new FileInputStream(PATH + "07版本excel.xls");
            // 1、工作簿
            Workbook workbook = new XSSFWorkbook(fis);
            // 2.得到表   可以根据索引也可以根据表的名称
            Sheet sheet = workbook.getSheetAt(0);
            // 3、得到行
            Row row = sheet.getRow(1);
            // 4、得到列   锁定单元格
            Cell cell = row.getCell(0);
            // 5、根据类型得到单元格中的内容
            String value = cell.getStringCellValue();
    
            System.out.println(value);
        }

    循环读取多个不同类型的数据

     // 读取多个
        @Test
        public void Read03teset02() throws Exception {
           String path = PATH + "人员.xlsx";
           getData(path);
        }
        public static void getData(String path){
            // 0、得到文件输入流
            FileInputStream fis = null;
            try {
                fis = new FileInputStream(path);
                Workbook workbook = new XSSFWorkbook(fis);
                Sheet sheet = workbook.getSheetAt(0);
    
                // 1.拿到第一行所有为String类型的数据
                Row row = sheet.getRow(0);
                if (row != null) {
                    int cellCount = row.getPhysicalNumberOfCells();  // 该行总共的单元格数
                    for (int cellNum = 0; cellNum < cellCount; cellNum++) {
                        Cell cell = row.getCell(cellNum);
                        if (cell != null) {
                            String cellTitle = cell.getStringCellValue();
                            System.out.print(cellTitle + "|");
                        }
    
                    }
                    System.out.println("");
                }
    
                // 2.拿到剩下行数中的数据
                int rowCount = sheet.getPhysicalNumberOfRows();  // 总行数
                for (int rowNum = 1; rowNum < rowCount; rowNum++) {
                    Row rowData = sheet.getRow(rowNum);
                    int cellCount = rowData.getPhysicalNumberOfCells();  //总单元格数
    
                    String cellValue = "";
    
                    for (int cellNum = 0; cellNum < cellCount; cellNum++) {
                        Cell cell = rowData.getCell(cellNum);
                        if (cell != null) {
                            // 判断类型
                            int cellType = cell.getCellType();
    
                            switch (cellType) {
    
                                case Cell.CELL_TYPE_STRING:   //  todo 字符串
                                    cellValue = cell.getStringCellValue();
                                    break;
    
                                case Cell.CELL_TYPE_NUMERIC:   // todo 数值 || 日期
                                    if (HSSFDateUtil.isCellDateFormatted(cell)){
                                        // 日期
                                        Date date= cell.getDateCellValue();
                                        cellValue = new DateTime().toString("yyyy-MM-dd hh:mm:ss");
                                    }else{
                                        // 数字   防止数字过长
                                        cell.setCellType(XSSFCell.CELL_TYPE_STRING);
                                        cellValue = cell.toString();
                                    }
                                    break;
    
                                case Cell.CELL_TYPE_BOOLEAN:  // todo 布尔
                                    boolean boolean_value = cell.getBooleanCellValue();www.devze.com
                                    cellValue = String.valueOf(boolean_value);
                                    break;
    
                                case Cell.CELL_TYPE_BLANK:   //  todo 为空
                                    System.out.print("[BLANK]");
                                    break;
    
                                case Cell.CELL_TYPE_ERROR:   //  todo 数据类型错误
                                    System.out.print("[数据类型错误]");
                                    break;
                            }
    
                            System.out.print(cellValue+"|");
                        }
                    }
                    System.out.println("");
                }
    
    
            } catch (IOException e) {
                e.printStackTrace();
            }finally {
                // 3 释放资源
                try {
                    fis.close();
                } catch (IOException e) {
                    e.printStackTrace();
                }
            }
    
        }

    计算公式

    在excel表格中存在着很多个公式 如:sum、排序、求平均值等。这个时候就需要进行判断。了解即可,需要时可以再看

     @Test
        public void test1() throws Exception {
            FileInputStream fis = new FileInputStream("E:\\JavaCode\\Maven\\excel-demo\\公式.xls");
            Workbook workbook = new HSSFWorkbook(fis);
            Sheet sheet = workbook.getSheetAt(0);
            Row row = sheet.getRow(2);
            Cell cell = row.getCell(0);
    
            // 得到表中的计算公式
            FormulaEvaLuator FormulaEvaluator = new HSSFFormulaEvaluator((HSSFWorkbook) workbook);
    
            // 得到单元格的内容
            int cellType = cell.getCellType();
            switch (cellType){
                case Cell.CELL_TYPE_FORMULA:  // 公式
                    // 拿到公式
                    String cellFormula = cell.getCellFormula();
                    System.out.println(cellFormula);
                    //计算
                    CellValue evaluate = FormulaEvaluator.evaluate(cell);
                    System.out.println("evaluate---"+evaluate); // org.apache.poi.ss.usermodel.CellValue [700.0]
                    String value = evaluate.formatAsString(); // 将数据格式化为字符串
                    System.out.println(value);
                    break;
            }
            
        }
    
    

    easyExcel读写数据

    根据实体类自动生成表

    第一步:导入依赖

    该依赖中自带了很多种依赖,如lombok、spring-boot等,需要我们在引入依赖时将自己已经导入的依赖删除,不然会报依赖冲突的错误

    <dependency>
    	<groupId>com.alibaba</groupId>
    	<artifactId>easyexcel</artifactId>
    	<version>3.1.4</version>
    </dependency>
    <dependency>
    	<groupId>org.projectlombok</groupId>
    	<artifactId>lombok</artifactId>
    	<version>1.18.8</version>
    </dependency>
    <dependency>
    	<groupId>com.alibaba</groupId>
    	<artifactId>fastjson</artifactId>
    	<version>1.2.75</version>
    </dependency>
    
    

    写数据

    第二步:创建excel表对应的实体类

    @Data
    public class DemoData {
        @ExcelProperty("字符串标题")
        private String string;
        @ExcelProperty("日期标题")
        private Date date;
        @ExcelProperty("数字标题")
        private Double aDouble;
        // 忽略该字段
        @ExcelIgnore
        private String ignore;
    }

    第三步:编写设置数据的方法

    使用集合list来写入excel

     public List easyTest1(){
           List<DemoData> list = new ArrayList<DemoData>();
            for (int i = 0; i < 10; i++) {
                DemoData data = new DemoData();
                data.setString("字符串"+i);
                data.setDate(new Date());
                data.setADouble(0.12);
                list.add(data);
            }
            return list;
        }

    第四步:编写测试类

    使用链式编写的方式

    write(文件路径,excel表对应的java类)

    sheet(设置表名)

    doWrite(数据)

     @Test
        public void test1(){
            String fileName ="E:\\JavaCode\\Maven\\excel-demo\\easyEasyData.xlsx";
            EasyExcel.write(fileName,DemoData.class).sheet("表1").doWrite(data());
        }

    读数据

    1、每执行一条excel表中的数据都会执行一次监听文件中的invoke方法,所以如果需要修改可以修改invoke方法中的内容

    2、DemoDataListener 不能被spring管理,要每次读取excel都要new,然后里面用到spring可以构造方法传进去

    第二步:准备一个对应excel表中字段的类

    与写操作中使用同一个类

    @Data
    public class DemoData {
        @ExcelProperty("字符串标题")
        private String string;
        @ExcelProperty("日期标题")
        private Date date;
        @ExcelProperty("数字标题")
        private Double aDouble;
        // 忽略该字段
        @ExcelIgnore
        private String ignore;
    }

    第三步:创建数据层 Mapper || Dao

    public class DemoDAO {
        public void save(List<DemoData> list) {
            // 如果是myBATis,尽量别直接调用多次insert,自己写一个mapper里面新增一个方法batchInsert,所有数据一次性插入
        }
    }

    第四步:创建监听器

    package excel.readEasy;
    
    import com.alibaba.excel.context.AnalysisContext;
    import com.alibaba.excel.metadata.CellExtra;
    import com.alibaba.excel.metadata.data.ReadCellData;
    import com.alibaba.excel.read.listener.ReadListener;
    import com.alibaba.excel.util.ListUtils;
    import com.alibaba.fastjson.JSON;
    import excel.easy.DemoData;
    import lombok.extern.slf4j.Slf4j;
    
    import java.util.List;
    import java.util.Map;
    
    // 有个很重要的点 DemoDataListener 不能被spring管理,要每次读取excel都要new,然后里面用到spring可以构造方法传进去
    @Slf4j
    public class DemoDataListener implements ReadListener<DemoData> {
        //每隔5条存储数据库,实际使用中可以100条,然后清理list ,方便内存回收
        private static final int BATCH_COUNT = 100;
        //缓存的数据
        priv编程ate List<DemoData> cachedDataList = ListUtils.newArrayListWithExpectedSize(BATCH_COUNT);
    
    
        //假设这个是一个DAO,当然有业务逻辑这个也可以是一个service。当然如果不用存储这个对象没用
        private DemoDAO demoDAO;
    
        // 这里是demo,所以随便new一个。实际使用如果到了spring,请使用下面的有参构造函数
     http://www.devze.com   public DemoDataListener() {
            demoDAO = new DemoDAO();
        }
    
        //如果使用了spring,请使用这个构造方法。每次创建Listener的时候需要把spring管理的类传进来
        public DemoDataListener(DemoDAO demoDAO) {
            this.demoDAO = demoDAO;
        }
    
    
        @Override
        public void onException(Exception exception, AnalysisContext context) throws Exception {
    
        }
    
        @Override
        public void invokeHead(Map<Integer, ReadCellData<?>> headMap, AnalysisContext context) {
            System.out.println("111");
        }
    
        //这个每一条数据解析都会来调用
        @Override
        public void invoke(DemoData data, AnalysisContext analysisContext) {
            System.out.println("2222");
            System.out.println(JSON.toJSONString(data));
            //  log.info("解析到一条数据:{}", JSON.toJSONString(data));
            cachedDataList.add(data);
            // 达到BATCH_COUNT了,需要去存储一次数据库,防止数据几万条数据在内存,容易OOM
            if (cachedDataList.size() >= BATCH_COUNT) {
                saveData();
                // 存储完成清理 list
                cachedDataList = ListUtils.newArrayListWithExpectedSize(BATCH_COUNT);
            }
        }
    
        @Override
        public void extra(CellExtra extra, AnalysisContext context) {
    
        }
    
        //所有数据解析完成了 都会来调用
        @Override
        public void doAfterAllAnalysed(AnalysisContext analysisContext) {
            saveData();
            log.info("所有数据解析完成!");
        }
    
        @Override
        public boolean hasNext(AnalysisContext context) {
            return false;
        }
    
        /**
         * 加上存储数据库
         */
        private void saveData() {
            log.info("{}条数据,开始存储数据库!", cachedDataList.size());
            demoDAO.save(cachedDataList);
            log.info("存储数据库成功!");
        }
    }

    第五步:测试

    @Test
        public void test3() {
            Stringhttp://www.devze.com fileName = "E:\\JavaCode\\Maven\\excel-demo\\easyEasyData.xlsx";
            EasyExcel.read(fileName, DemoData.class, new PageReadListener<DemoData>(dataList -> {
                for (DemoData demoData : dataList) {
                    System.out.println(JSON.toJSONString(demoData));
                }
            })).sheet().doRead();
        }

    以上就是Java操作Excel的示例详解的详细内容,更多关于Java操作Excel的资料请关注我们其它相关文章!

    0

    精彩评论

    暂无评论...
    验证码 换一张
    取 消

    关注公众号