网站导航免费论文 原创论文 论文搜索 原创论文 网学软件 学术大家 资料中心 会员中心 问题解答 原创论文 论文素材 设计下载 最新论文 下载排行 论文上传 在线投稿 联系我们
返回网学首页
网学联系
最新论文 推荐专题 热门论文 素材专题
当前位置: 网学 > 编程文档 > C/C++ > 正文
彻底理解C、C++、Win32与COM中的字符串_C/C++_开发语
来源:Http://myeducs.cn 联系QQ:点击这里给我发消息 作者: 用户投稿 来源: 网络 发布时间: 12/11/27
下载{$ArticleTitle}原创论文样式

  C/C++中的字符串问题在网上的讲解一向非常含糊,存在各个层次的库混用、滥用的情况,尤其是宽字符与窄字符等问题很难找到有效的资料,本篇随笔分享一下我长期收集到的一些比较准确的资料以及据此得到的个人理解.

  C语言中的字符串

  C语言中提供了两种字符类型char和wchar_t,C语言使用字符数组来表示字符串,同时支持两种直接量写法:"abcd"和 L"abcd" 来表示字符串常量文字量,C语言允许用字符串常量来初始化字符串。标准C函数库提供了printf和wprintf两个版本的输出函数。

#include <stdio.h> 
int main(){ 
    char str[] = "abcd"; 
    wchar_t wstr[] = L"abcd数学"; 
    printf("%s\n",str); 
    wprintf(L"%s\n",wstr); 
    return 0; 
}

  纯C语言环境下,可以使用两个函数wcstombs和mbstowcs 来进行宽窄字符串的互相转换,下面一段是C语言中wcstombs的例子

#include <stdio.h> 
#include <stdlib.h> 
int main(){ 
    char str[] = "abcd"; 
    wchar_t wstr[] = L"bcda"; 
    wcstombs(str,wstr,sizeof(str)); 
    printf("%s\n",str); 
    return 0; 
}

  这两个函数都声明在C标准库头文件stdlib.h中。其它配套的字符串操作都在头文件string.h和wchar.h

  C++语言中的字符串

  C++中我们有了字符串类string和wstring,这两个类都在头文件string当中,并且iostream中也提供了各自对应版本的输出流:

#include <string> 
#include <iostream> 
int main(){ 
    std::string str = "abcd"; 
    std::wstring wstr = L"abcd"; 
    std::cout<<str<<std::endl; 
    std::wcout<<wstr<<std::endl;  
    return 0; 
} 

  C++中转换就很容易了,构造字符串的时候把另一个的迭代器传入就可以了:

#include <string> 
#include <iostream> 
int main(){ 
    std::string str = "abcd"; 
    std::wstring wstr(str.begin(),str.end()); 
    std::wcout<<wstr<<std::endl; 
    return 0; 
}

  对于已经存在的字符串,可以用assign来赋值。因为宽字符有些窄字符中没有的字符,所以当你要指定一些转换规则时,可以使用头文件algorithm中的transform函数。其它字符串相关操作也在头文件string的类定义当中。

  Win32编程中的字符串

  但是我们实际编程中,遇到字符集问题比较多的情况是Win32编程。Win32SDK为了避免编译器造成的差异,用宏定义了自己的一套类型系统,其中字符类型就是CHAR和WCHAR,比较特别的是,Win32编程支持编译时的Unicode和非Unicode指定,所以Win32SDK又提供了 TCHAR类型,它会根据是否是Unicode环境自动选择CHAR或者WCHAR类型,没有特别要求时,我们一般应该使用TCHAR。

  CHAR和WCHAR的字面值分别是"abcd"和L"abcd",而TCHAR对应的字面值是_T"abcd",或者TEXT("abcd")。

  Win32类型系统中还定义了字符串类型,见下表:

PSTR  PCSTR  LPSTR  LPCSTR
PTSTR PCTSTRLPTSTR LPCTSTR
PWSTR PCWSTR LPWSTR LPCWSTR

  其中我们把STR的前缀分成了不同的颜色,红色前缀可能是P或者LP,P表示指针,LP表示长整型指针。大部分系统中P和LP是同一类型,所以这个前缀是不会造成区别的,可能64位C++或者一些旧的16位C++环境中会有区别。

  蓝色前缀可能是C或者没有,这个很简单,表示是否是常量指针。

  绿色前缀可能是T、W或者没有,这对应着CHAR、WCHAR以及TCHAR。
对于转换问题,Windows提供了两个API函数,这里就不实际举例了,具体请参看MSDN:
MultiByteToWideChar WideCharToMultiByte

  其它与这些类型配套的Win32API函数请参看:MSDN中的参考

  MFC中的CString类型提供了这些API的封装,编程时使用可以省去不少麻烦。

  COM中的字符串

  COM中提供了一个BSTR类型,它是OLECHAR的字符串形式(OLECHAR可能是WCHAR或者CHAR,取决于系统的OLE字符集),很多人因为看了它的宏定义:

typedef /* [wire_marshal] */ OLECHAR *BSTR;

  认为它只是简单的OLECHAR *甚至WCHAR*,但是并非如此。BSTR所指向的内存地址前几个字节也是被分配的空间,用于存储BSTR的长度等信息。所以BSTR对应着一整套相关操作函数:

彻底理解C、C++、Win32与COM中的字符串SysAllocString

彻底理解C、C++、Win32与COM中的字符串SysAllocStringByteLen

彻底理解C、C++、Win32与COM中的字符串SysAllocStringLen

彻底理解C、C++、Win32与COM中的字符串SysFreeString

彻底理解C、C++、Win32与COM中的字符串SysReAllocString

彻底理解C、C++、Win32与COM中的字符串SysReAllocStringLen

彻底理解C、C++、Win32与COM中的字符串SysStringByteLen

彻底理解C、C++、Win32与COM中的字符串SysStringLen

  如果你在自己分配的WCHAR*上使用这些函数,一定会导致问题。同样道理,如果你试图用delete去释放BSTR,也会造成错误。但是有相当一部分针对WCHAR的Win32API可以用在BSTR上。

  好了,就这么多了,希望您读了这篇随笔以后能对各种环境中的字符串有个整体认识。

(责任编辑:admin)

网学推荐

免费论文

原创论文

浏览:
设为首页 | 加入收藏 | 论文首页 | 论文专题 | 设计下载 | 网学软件 | 论文模板 | 论文资源 | 程序设计 | 关于网学 | 站内搜索 | 网学留言 | 友情链接 | 资料中心
版权所有 QQ:3710167 邮箱:3710167@qq.com 网学网 [Myeducs.cn] 您电脑的分辨率是 像素
Copyright 2008-2015 myeducs.Cn www.myeducs.Cn All Rights Reserved
湘ICP备09003080号