专业编程基础技术教程

网站首页 > 基础教程 正文

C|写入UTF-8编码格式的文本文件 c++utf-8

ccvgpt 2024-10-12 13:32:23 基础教程 11 ℃

通常用C语言库函数写入的都是ANSI编码格式的文本文件,有时数据处理需要的是UTF-8格式的文本文件。

先将字符串编码转换为UTF-8格式的,然后再写入。

C|写入UTF-8编码格式的文本文件 c++utf-8

另一种方式可供参考:为 fopen 指定utf-8编码格式,然后写入 wchar_t 字符串,最终写入的文件就是UTF-8编码的了。

附代码1:

#include <stdio.h>
#include <string.h>
#include <Windows.h>
 
int main()
{
	FILE* fp = fopen("original.txt", "wb+");
 
	// 写入UTF-8的BOM文件头
	char header[3] = {(char)0xEF, (char)0xBB, (char)0xBF};
	fwrite(header, sizeof(char), 3, fp);
	
	char* str = "Hello, 你好!";
	int len = strlen(str);
	wchar_t *wc = (wchar_t *)malloc(sizeof(wchar_t)*len);
	//wchar_t wc[256];
	// 将ANSI编码的多字节字符串转换成宽字符字符串
	int n = MultiByteToWideChar(CP_ACP, 0, str, len, wc, len);
	if ( n > 0 )
	{
		wc[n] = 0;
		char *mb = (char *)malloc(sizeof(char)*len*4);
		// char mb[1024];
		// 将宽字符字符串转换成UTF-8编码的多字节字符串
		n = WideCharToMultiByte(CP_UTF8, 0, wc, wcslen(wc), \
			mb, len*4, NULL, NULL);
		if ( n > 0 )
		{
			mb[n] = 0;
			fwrite(mb, sizeof(char), strlen(mb), fp);
			printf("写入成功!");
		}
		free(mb);
	}
	free(wc);
	fclose(fp);
	system("pause");
	return 0;
}

附代码2:

#include <stdio.h>
#include <tchar.h>
#include <locale.h>
wchar_t * char2wchar(const char* cchar) ;
int main()
{
	FILE* fp = fopen("test.txt", "wt+,ccs=UTF-8");
	char *str = "hello, 你好!";
	wchar_t* s = char2wchar(str);
	fwrite(s, sizeof(wchar_t), wcslen(s), fp);
	fclose(fp);
	return 0;
}
wchar_t * char2wchar(const char* cchar) 
{ 
	wchar_t *m_wchar; 
	int len = MultiByteToWideChar( CP_ACP ,0,cchar ,strlen( cchar), NULL,0); 
	m_wchar= new wchar_t[len+1]; 
	MultiByteToWideChar( CP_ACP ,0,cchar,strlen( cchar),m_wchar,len); 
	m_wchar[len]= '\0' ; 
	return m_wchar; 
}

-End-

Tags:

最近发表
标签列表