格式化字符串——以C++的名义(zt)2009-12-22 10:59从第一堂C语言课上的那个printf开始,格式化字符串就成了我的梦魇。
此后我还在很多地方遇到过它们:fprintf,sscanf以及CString的Format成员函数……。
除了能记住%s(String 的缩写)代表字符串,%d(Decimal的缩写)代表整数之外,每次用到格式化字符串的地方我都要求助于MSDN。
直到我看到C++的字符串格式化方式后,我决定从此抛弃C的那套格式化字符串的方法。
在C++里格式化字符串,用到的最多的类是:ostringstream以及它的宽字符版本wostringstream。
话不多说,如果要将一个整数n格式化成字符串以便输出之用CString的方式是这样的:CStringstr;str.Format(_T("%d"), n);ostringstream的方式:ostringstreamost;ost<<n;string str = ost.str();抛开效率不谈,起码不用再去记%d代表整数,%f代表浮点数,当然还有更复杂的格式控制输出的那些%(此处省略200字……)。
稍微复杂一点,如果要将整数以16进制的格式输出(这个恐怕是整数输出中最常用的功能了)ostringstreamost;ost<<hex<<showbase<<255;把一个字节序列以16进制的方式输出,最常见的情况比如16进制的方式输出MAC地址:ost<<hex<<setfill('0');ost<<setw(2)<<(int)x;一定是输出一个int,否则无效。
如果以16进制大写的格式输出:ostringstreamost;ost<<hex<<showbase<<uppercase<<255;可有时候希望以32位整数的方式来输出的时候,在前面通常要补上多个0,这时可以这样做:ostringstreamost;// 也许有更好的写法ost<<"0X"<<hex<<uppercase<<setw(8)<<setfill('0')<<255;比起格式化字符串来输入的字母更多,但我觉得这种以人话写出来的方式比较好记:)对于浮点数,最长用的格式化功能莫过于在小数点后保留X位的做法。
比如在小数点后保留6位:ostringstreamost;// 将输出1234.567800ost<<fixed<<setprecision(6)<<1234.5678;保留3位// 将输出1234.568,已经替我们做好了四舍五入ost<<fixed<<setprecision(3)<<1234.5678;实现机制C++使用一种称为操控符的技术来控制格式化的输出。
经典的Hello World的C++版本大概是这样的:std::cout<<"Hello World"<<endl; 这将在标准输出上输出Hello World后附带一个换行,并且刷新cout流。
一个简单的endl包含了模板和运算符重载两个C++中极有分量的技术。
对endl的输出将引发下面这个重载了的<<运算符的调用(摘自VS2008的ostream文件):_Myt& __CLR_OR_THIS_CALL operator<<(_Myt& (__cdecl *_Pfn)(_Myt&))...{ // call basic_ostream manipulator_DEBUG_POINTER(_Pfn);return ((*_Pfn)(*this));} 而endl正好满足了这个重载的运算符的参数的格式:_CRTIMP2_PURE inline basic_ostream<char, char_traits<char>>&__CLRCALL_OR_CDECL endl(basic_ostream<char, char_traits<char>>& _Ostr)...{ // insert newline and flush byte stream_Ostr.put(' ');_Ostr.flush();return (_Ostr);} 这样:cout<<endl;就解释为在endl函数的内部对它的参数_Ostr,也就是cout输入一个换行符,然后刷新流。
有点复杂吧:)再来看个稍微复杂点的,看看语句ost<<setprecision(3)<<1234.5678;里的setprecision(3)到底是什么一个东东:在iomanip.cpp里找到setprecision的函数定义:_MRTIMP2 _Smanip<streamsize> __cdeclsetprecision(streamsizeprec)...{ // manipulator to set precisionreturn (_Smanip<streamsize>(&spfun, prec));} 发现这个函数返回了一个_Smanip<streamsize>类型的对象。
streamsize的类型是int,这里的prec肯定是传过来的3,那构造_Smanip<streamsize>对象时的另一个参数spfun是什么东西?同样是在iomanip.cpp里,spfun函数定义如下:static void __cdeclspfun(ios_base&iostr, streamsizeprec)...{ // set precisioniostr.precision(prec);} 发现在这个函数的内部,对流iostr调用了precesion函数。
运算符<<有这样一个重载的版本:template<class _Elem,class _Traits,class _Arg> inlinebasic_ostream<_Elem, _Traits>& __CLRCALL_OR_CDECL operator<<(basic_ostream<_Elem, _Traits>& _Ostr, const _Smanip<_Arg>& _Manip)...{ // insert by calling function with output stream and argument(*_Manip._Pfun)(_Ostr, _Manip._Manarg);return (_Ostr);} 这样,第一个参数就是cout,而第二个参数就是setprecision函数返回的一个临时的_Smanip<streamsize>类型的对象。
在<<运算符内部,如果(*_Manip._Pfun)(_Ostr, _Manip._Manarg);就是调用spfun函数并将cout和3传过去就好了!Go on!看看_Manip._Pfun到底是什么东西:// TEMPLATE STRUCT _Smaniptemplate<class _Arg>struct _Smanip...{ // store function pointer and argument value_Smanip(void (__cdecl *_Left)(ios_base&, _Arg), _Arg _Val): _Pfun(_Left), _Manarg(_Val)...{ // construct from function pointer and argument value}void (__cdecl *_Pfun)(ios_base&, _Arg); // the function pointer_Arg _Manarg; // the argument value}; 既然当初在setprecision函数里,传递的是spfun,那么_Pfun就是spfun函数的指针啦。
OK,大功告成!C++的表现力很强大吧!虽然绕了这么大一个弯子只不过为了调用一下cout.precision(3),那为什么不这样写?cout.precision(3);cout<<1234.5678;显然写成一条语句ost<<fixed<<setprecision(3)<<1234.5678;逻辑上更有意义ostringstream使用时的一个小技巧:当用ostringstream格式化完毕后,通过调用它的str成员函数可以得到格式化后的字符串:ostringstreamost;// 格式化的工作……string str = ost.str();如果接下来要继续在这个流对象上进行其它的格式化工作,那么要先清空ostringstream的缓存,传递一个空字符串就好。
ost.str("");这是个GUI盛行的年代,从标准输入显得已经不那么重要了,但是从文件读入依然是个很重要的操作,可我一直都是用WinAPI进行文件的读写的,以后也许会再写一片与格式化输入有关的文章。