window java.lang.UnsatisfiedLinkError: org.apache.hadoop.io.nativeio.NativeIO$POSIX

胖胖胖胖胖虎

98人浏览 · 2026-01-08 11:48:34

胖胖胖胖胖虎 · 2026-01-08 11:48:34 发布

import org.apache.spark.sql.Dataset;
import org.apache.spark.sql.Row;
import org.apache.spark.sql.RowFactory;
import org.apache.spark.sql.SparkSession;
import org.apache.spark.sql.catalyst.plans.logical.LogicalPlan;
import org.apache.spark.sql.execution.SparkPlan;
import org.apache.spark.sql.types.DataTypes;
import org.apache.spark.sql.types.Metadata;
import org.apache.spark.sql.types.StructField;
import org.apache.spark.sql.types.StructType;

import java.util.Arrays;
import java.util.List;

public class SparkTask {

    public static void main(String[] args) {

        System.setProperty("HADOOP_HOME", "D:\\hadoop-3.0.3");
        System.setProperty("HIVE_HOME", "D:\\apache-hive-3.1.0-bin");
        System.setProperty("HIVE_CONF_DIR", "D:\\apache-hive-3.1.0-bin\\conf");

        SparkSession sparkSession = SparkSession
                .builder()
                .master("local[*]")
//                .config("spark.sql.queryExecutionListeners", "com.crock.listener.FieldLineageListener")  // 注册监听器
                .enableHiveSupport()
                .getOrCreate();

        // 创建示例数据
        List<Row> data = Arrays.asList(
                RowFactory.create(100, "Alice", 34),
                RowFactory.create(10, "Bob", 45),
                RowFactory.create(1,"Cathy", 29)
        );

        // 定义 schema
        StructType schema = new StructType(new StructField[]{
                new StructField("id", DataTypes.IntegerType, false, Metadata.empty()),
                new StructField("name", DataTypes.StringType, false, Metadata.empty()),
                new StructField("age", DataTypes.IntegerType, false, Metadata.empty())
        });

        // 创建 DataFrame
        Dataset<Row> dfA = sparkSession.createDataFrame(data, schema);

        // 创建示例数据
        List<Row> datab = Arrays.asList(
                RowFactory.create(100, "Alice", 34),
                RowFactory.create(10, "Bob", 45),
                RowFactory.create(1,"Cathy", 29)
        );

        // 定义 schema
        StructType schemab = new StructType(new StructField[]{
                new StructField("id", DataTypes.IntegerType, false, Metadata.empty()),
                new StructField("name", DataTypes.StringType, false, Metadata.empty()),
                new StructField("age", DataTypes.IntegerType, false, Metadata.empty())
        });

        // 创建 DataFrame
        Dataset<Row> dfB = sparkSession.createDataFrame(datab, schemab);

        sparkSession.sql("create table if not exists table_c (id int, name string)");

        // 创建临时视图（只在当前 session 有效）
        dfA.createOrReplaceTempView("table_a");
        dfB.createOrReplaceTempView("table_b");

        Dataset<Row> sql = sparkSession.sql("insert into table_c SELECT a.id, b.name FROM table_a a JOIN table_b b ON a.id = b.id");

//        Dataset<Row> sql = sparkSession.sql("with abc as (select 1 as id , 'abc' as name) SELECT a.id, b.name FROM table_a a JOIN table_b b ON a.id = b.id join abc on a.id=abc.id");
//        sql.explain(true);

//        sql.logicalPlan();
        System.out.println("---------------------------analyzer--------------------------------------");
        LogicalPlan analyzed = sql.queryExecution().analyzed();
        System.out.println(analyzed);
        System.out.println("---------------------------analyzer--------------------------------------");
        LogicalPlan optimizedPlan = sql.queryExecution().optimizedPlan();
        System.out.println(optimizedPlan);
        System.out.println("---------------------------物理执行计划--------------------------------------");
        SparkPlan sparkPlan = sql.queryExecution().sparkPlan();
        System.out.println(sparkPlan);
        System.out.println("---------------------------执行计划--------------------------------------");
        SparkPlan executedPlan = sql.queryExecution().executedPlan();
        System.out.println(executedPlan);

//        System.out.println(sql.queryExecution().logical());

    }

}

问题：

`java.lang.UnsatisfiedLinkError: org.apache.hadoop.io.nativeio.NativeIO$POSIX.stat(Ljava/lang/String;)`

在这里插入图片描述

下载 hadoop 配置 HADOOP_HOME 环境变量

通过 https://github.com/Zer0r3/winutils ，下载 winutils.exe、hadoop.dll 注意版本对应，winutils.exe 放到 %HADOOP_HOME%/bin 目录下，hadoop.dll 放到 c:/Windows/System32
在这里插入图片描述

----------------------------- 以下没用到 -----------------------------

下载 hadoop 源码
复制 org.apache.hadoop.io.nativeio.NativeIO 源码并新建 NativeIO.java
在这里插入图片描述

参考：https://zhuanlan.zhihu.com/p/551108454

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

Elasticsearch复杂数据类型终极指南：从入门到精通

Elasticsearch作为功能强大的搜索引擎，支持多种复杂数据类型，让开发者能够灵活处理各种结构化和非结构化数据。本文将带你全面了解Elasticsearch中的复杂数据类型，从基础概念到实际应用，助你轻松掌握数据建模的核心技巧。## 内部对象：构建层级化数据结构在Elasticsearch中，对象类型（Object）是最基础的复杂数据类型之一，用于表示具有嵌套关系的数据。例如，我们可

腾讯云开发者社区

终极指南：Flink SQL连接器版本管理从混乱到有序的升级之路

Apache Flink作为流处理领域的佼佼者，其SQL连接器的版本管理一直是开发者面临的核心挑战。本文将系统讲解Flink SQL连接器版本管理的最佳实践，帮助你轻松应对版本兼容性问题，实现从混乱到有序的升级之旅。## 连接器版本管理的常见痛点 😫在Flink应用开发中，连接器版本管理常常让开发者头疼不已。不同版本的连接器可能导致各种兼容性问题，例如API变更、功能差异甚至运行时错误。

腾讯云开发者社区

如何快速搭建Neon无服务器PostgreSQL：面向初学者的完整指南

Neon是一款革命性的无服务器PostgreSQL解决方案，它通过分离存储和计算层，实现了自动扩缩容、类代码式数据库分支以及零级扩展能力。本指南将帮助你从零开始搭建Neon开发环境，体验这款创新数据库的强大功能。## 准备工作：环境要求与依赖项在开始搭建Neon环境前，请确保你的系统满足以下要求：- Linux操作系统（推荐Ubuntu 20.04+或Debian 11+）- Git