如何識(shí)別電子發(fā)票中的二維碼(java實(shí)現(xiàn))

項(xiàng)目中有個(gè)ocr軟件識(shí)別發(fā)票信息的需求,實(shí)際使用中發(fā)現(xiàn)識(shí)別率有點(diǎn)低。后來(lái)發(fā)現(xiàn)對(duì)于電子發(fā)票,可以直接識(shí)別二維碼讀取部分票面信息,然后用這部分信息作為參數(shù),通過(guò)調(diào)用稅務(wù)的接口獲取全票面信息。只要是正常的電子發(fā)票,識(shí)別率差不多是100%。

創(chuàng)作不易,轉(zhuǎn)載請(qǐng)注明出處


        <dependency>
            <groupId>org.apache.pdfbox</groupId>
            <artifactId>pdfbox</artifactId>
            <version>2.0.20</version>
        </dependency>
        <dependency>
            <groupId>com.google.zxing</groupId>
            <artifactId>core</artifactId>
            <version>3.1.0</version>
        </dependency>
        <dependency>
            <groupId>com.google.zxing</groupId>
            <artifactId>javase</artifactId>
            <version>3.1.0</version>
        </dependency>



        /**
     * 獲取電子發(fā)票pdf文件中的發(fā)票信息
     * @param filePath 電子發(fā)票路徑
     * @return 發(fā)票信息
     */
    public Invoice getInvoiceInfo(String filePath) {
        try {
            List<BufferedImage> imageList = extractImage(new File(filePath));
            if (imageList.isEmpty()) {
                logger.info("pdf中未解析出圖片,返回空");
                return null;
            }
            
            MultiFormatReader formatReader = new MultiFormatReader();
            //正常解析出來(lái)有3張圖片,第一張是二維碼,其他兩張圖片是發(fā)票上蓋的章
            BinaryBitmap binaryBitmap = new BinaryBitmap(new HybridBinarizer(new BufferedImageLuminanceSource(imageList.get(0))));
            Map hints = new HashMap<>();
            hints.put(EncodeHintType.CHARACTER_SET, "utf-8");
            Result result = formatReader.decode(binaryBitmap);
            if (result == null || StringUtils.isEmpty(result.getText())) {
                logger.info("pdf中的第一張圖片沒(méi)有解析了字符串信息,直接返回空");
                return null;
            }
            
            logger.info("從電子發(fā)票中識(shí)別出的信息為:{}",  result.getText());
            
            // 讀取到的信息為 : 01,發(fā)票類型,發(fā)票代碼,發(fā)票號(hào)碼,發(fā)票金額,開(kāi)票日期,校驗(yàn)碼,隨機(jī)產(chǎn)生的摘要信息
            String[] infos = result.getText().split(",");
            if (infos.length != 8) {
                logger.info("pdf中的第一張圖片解析出的字符串?dāng)?shù)組長(zhǎng)度不為8,返回空。");
                return null;
            }
            
            Invoice invoice = new Invoice();
            invoice.setInvoiceType(infos[1]); //發(fā)票類型
            invoice.setInvoiceCode(infos[2]); //發(fā)票代碼
            invoice.setInvoiceNo(infos[3]); // 發(fā)票號(hào)碼
            invoice.setAmount(new BigDecimal(infos[4])); // 發(fā)票金額
            invoice.setInvoiceDate(DateUtils.parseDate(infos[5], "yyyyMMdd")); //開(kāi)票日期
            invoice.setCheckCode(infos[6]); // 校驗(yàn)碼
            
            return invoice;
        } catch (Exception e) {
            logger.info("解析pdf中的二維碼出現(xiàn)異常", e);
            return null;
        }
    }


       /**
     * 提取電子發(fā)票里面的圖片
     * @param pdfFile 電子發(fā)票文件對(duì)象
     * @return pdf中解析出的圖片列表
     * @throws Exception
     */
    private List<BufferedImage>  extractImage(File pdfFile) throws Exception {
        List<BufferedImage> imageList = new ArrayList<BufferedImage>();
        
        PDDocument document = PDDocument.load(pdfFile);
        PDPage page = document.getPage(0); //電子發(fā)票只有一頁(yè)
        PDResources resources = page.getResources();
        
        for (COSName name : resources.getXObjectNames()) {
            if (resources.isImageXObject(name)) {
                PDImageXObject obj = (PDImageXObject)resources.getXObject(name);
                imageList.add(obj.getImage());
            }
        }
        return imageList;
    }

創(chuàng)作不易,轉(zhuǎn)載請(qǐng)注明出處

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 漸變的面目拼圖要我怎么拼? 我是疲乏了還是投降了? 不是不允許自己墜落, 我沒(méi)有滴水不進(jìn)的保護(hù)膜。 就是害怕變得面...
    悶熱當(dāng)乘涼閱讀 4,502評(píng)論 0 13
  • 夜鶯2517閱讀 128,210評(píng)論 1 9
  • 版本:ios 1.2.1 亮點(diǎn): 1.app角標(biāo)可以實(shí)時(shí)更新天氣溫度或選擇空氣質(zhì)量,建議處女座就不要選了,不然老想...
    我就是沉沉閱讀 7,505評(píng)論 1 6
  • 我是一名過(guò)去式的高三狗,很可悲,在這三年里我沒(méi)有戀愛(ài),看著同齡的小伙伴們一對(duì)兒一對(duì)兒的,我的心不好受。怎么說(shuō)呢,高...
    小娘紙閱讀 3,875評(píng)論 4 7
  • 那一年,我選擇了獨(dú)立遠(yuǎn)行,火車帶著我在前進(jìn)的軌道上爬行了超過(guò)23個(gè)小時(shí); 那一年,我走過(guò)泥濘的柏油路,在那個(gè)遠(yuǎn)離故...
    木芽閱讀 1,959評(píng)論 4 5

友情鏈接更多精彩內(nèi)容