导航菜单

软件工程/分布式存储与计算
课程进度 44% · 第4/8章4/8章 · 标签 1/2
1

HDFS分布式文件系统

HDFS(Hadoop Distributed File System)是 Hadoop 的核心存储组件,将大文件分块存储在多台机器上。

bash
1
hdfs dfs -ls /data
2
hdfs dfs -put local.txt /data/
2

Hive数据仓库

Hive 提供类 SQL 查询能力,将 HQL 转换为 MapReduce/Spark 任务执行。

sql
1
CREATE TABLE users(id INT, name STRING);
2
SELECT * FROM users;