博客
关于我
Mdrill 测试数据写入程序
阅读量:800 次
发布时间:2023-02-08

本文共 2004 字,大约阅读时间需要 6 分钟。

写入数据到Hadoop分布式文件系统中的TV表数据

最近在项目中需要将大量数据写入Hadoop分布式文件系统中的TV表中,本文将详细介绍SQL表的创建和Java代码实现。

TV表的SQL定义如下:

CREATE TABLE tv (thedate STRING,tv STRING)

Java代码实现:

import java.io.BufferedWriter;import java.io.IOException;import java.io.OutputStreamWriter;import java.text.SimpleDateFormat;import java.util.Calendar;import java.util.Date;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.FSDataOutputStream;import org.apache.hadoop.fs.FileSystem;import org.apache.hadoop.fs.Path;

public class ImportData {

private static Configuration conf = null;private static FileSystem fs = null;public static void main(String[] args) throws IOException {    conf = ConfigurationUtil.getConf();    fs = FileSystem.get(conf);    String pathString = "/group/tbdp-etao-adhoc/p4padhoc/tablelist/tv";    Calendar calendar = Calendar.getInstance();    calendar.setTime(new Date());    calendar.set(2013, 1, 1);    SimpleDateFormat sf = new SimpleDateFormat("yyyyMMdd");    while (calendar.get(Calendar.YEAR) < 2014) {        String dateStr = sf.format(calendar.getTime());        String path = pathString + "/dt=" + dateStr;        mkdir(path);        writeTVData(path, dateStr);        calendar.add(Calendar.DAY_OF_YEAR, 1);    }    fs.close();}public static void writeTVData(String dir, String dateStr) throws IOException {    FSDataOutputStream fos = null;    OutputStreamWriter osw = null;    BufferedWriter bw = null;    fos = fs.create(new Path(dir + "/data.txt"), false);    osw = new OutputStreamWriter(fos);    bw = new BufferedWriter(osw);    for (int i = 0; i < 100000; i++) {        StringBuffer strBuffer = new StringBuffer();        strBuffer.append(dateStr);        strBuffer.append((char) 1);        strBuffer.append(i);        strBuffer.append(System.lineSeparator());        bw.write(strBuffer.toString());    }    bw.close();    osw.close();    fos.close();}public static void mkdir(String dir) throws IOException {    Path p = new Path(dir);    if (!fs.exists(p)) {        fs.mkdirs(p);    }}

}

转载地址:http://pmyfk.baihongyu.com/

你可能感兴趣的文章
Net和T-sql中的日期函数操作
查看>>
Net处理html页面元素工具类(HtmlAgilityPack.dll)的使用
查看>>
Net操作Excel(终极方法NPOI)
查看>>
Net操作配置文件(Web.config|App.config)通用类
查看>>
net网络查看其参数state_dict,data,named_parameters
查看>>
Net连接mysql的公共Helper类MySqlHelper.cs带MySql.Data.dll下载
查看>>
NeurIPS(神经信息处理系统大会)-ChatGPT4o作答
查看>>
neuroph轻量级神经网络框架
查看>>
Neutron系列 : Neutron OVS OpenFlow 流表 和 L2 Population(7)
查看>>
new Blob()实现不同类型的文件下载功能
查看>>
New Concept English three (35)
查看>>
NEW DATE()之参数传递
查看>>
New Journey--工作五年所思所感小记
查看>>
new Queue(REGISTER_DELAY_QUEUE, true, false, false, params)
查看>>
New Relic——手机应用app开发达人的福利立即就到啦!
查看>>
new work
查看>>
new 一个button 然后dispose,最后这个button是null吗???
查看>>
NewspaceGPT的故事续写能力太强了
查看>>
NewspaceGPT绘制时序图
查看>>
NewspaceGPT绘制类图
查看>>