课程进度 44% · 第4/8章第4/8章 · 标签 1/2
— 1 —
HDFS分布式文件系统
HDFS(Hadoop Distributed File System)是 Hadoop 的核心存储组件,将大文件分块存储在多台机器上。
bash
1
hdfs dfs -ls /data
2
hdfs dfs -put local.txt /data/
— 2 —
Hive数据仓库
Hive 提供类 SQL 查询能力,将 HQL 转换为 MapReduce/Spark 任务执行。
sql
1
CREATE TABLE users(id INT, name STRING);
2
SELECT * FROM users;