C++中本身是存在左值,右值的概念,但是在C11中又出现了左值,纯右值,将亡值得概念;这里我们主要介绍这些值的概念。
一.表达式
定义:由运算符和运算对象构成的计算式(类似数学中的算术表达式)
每个 C++ 表达式(带有操作数的操作符、字面量、变量名等)可按照两种独立的特性加以辨别:**类型和值类别 **(value category)。每个表达式都具有某种非引用类型,且每个表达式只属于三种基本值类别中的一种:纯右值 (prvalue)、亡值 (xvalue)、左值 (lvalue)。
二.值类别
对于表达式来说:表达式是可以求值的,对表达式求值将得到一个结果,这个结果有两个属性:类型和值类别。
在C++11以后表达式按值类别分类,必然属于以下三者之一:
- 左值
- 将亡值
- 纯右值
其中,左值和将亡值合称为泛左值,纯右值和将亡值合称为右值
三.左值
左值:能够用&取地址的表达式为左值表达式
下列表达式是左值表达式:
- 变量、函数、模板形参对象 (C++20 起)或数据成员的名字,不论类型,例如 std::cin 或 std::endl。即使变量的类型是右值引用,由它的名字构成的表达式仍是左值表达式;
- 返回类型是左值引用的函数调用或重载运算符表达式,例如 std::getline(std::cin, str)、std::cout << 1、str1 = str2 或 ++it;
- a = b,a += b,a %= b,以及所有其他内建的赋值及复合赋值表达式;
- ++a 和 --a,内建的前置自增与前置自减表达式;
- *p,内建的间接寻址表达式;
- a[n] 和 n[a],内建的下标表达式,当 a[n] 中的一个操作数是数组左值时 (C++11 起);
- a.m,对象成员表达式,除了 m 是成员枚举项或非静态成员函数,或者 a 是右值而 m 是对象类型的非静态数据成员的情况;
- p->m,内建的指针成员表达式,除了 m 是成员枚举项或非静态成员函数的情况;
- a.*mp,对象的成员指针表达式,其中 a 是左值且 mp 是数据成员指针;
- p->*mp,内建的指针的成员指针表达式,其中 mp 是数据成员指针;
- a, b,内建的逗号表达式,其中 b 是左值;
- a ? b : c,对某些 b 和 c 的三元条件表达式(例如,当它们都是同类型左值时,但细节见定义);
- 字符串字面量,例如 “Hello, world!”;
- 转换到左值引用类型的转型表达式,例如 static_cast<int&>(x);
- 返回类型是到函数的右值引用的函数调用表达式或重载的运算符表达式;(C++11 起)
- 转换到函数的右值引用类型的转型表达式,如 static_cast<void (&&)(int)>(x)。(C++11 起)
性质:
- 可以通过内建的取址运算符取左值的地址:&++i[1] 及 &std::endl 是合法表达式。
- 可修改的左值可用作内建赋值和内建复合赋值运算符的左操作数。
- 左值可以用来初始化左值引用;这会将一个新名字关联给该表达式所标识的对象。
四.纯右值
满足下列条件之一:
1.本身就是纯粹的字面值,如3,false,12.13
2.求值结果相当于字面值或是一个不具名的临时对象
下列表达式是纯右值表达式:
- (除了字符串字面量之外的)字面量,例如 42、true 或 nullptr;
- 返回类型是非引用的函数调用或重载运算符表达式,例如 str.substr(1, 2)、str1 + str2 或 it++;
- a++ 和 a-,内建的后置自增与后置自减表达式;
- a + b、a % b、a & b、a << b,以及其他所有内建的算术表达式;
- a && b、a || b、!a,内建的逻辑表达式;
- a < b、a == b、a >= b 以及其他所有内建的比较表达式;
- &a,内建的取地址表达式;
- a.m,对象成员表达式,其中 m 是成员枚举项或非静态成员函数[2],或其中 a 是右值且 m 是非- - 引用类型的非静态数据成员 (C++11 前);
- p->m,内建的指针成员表达式,其中 m 是成员枚举项或非静态成员函数[2];
- a.*mp,对象的成员指针表达式,其中 mp 是成员函数指针[2],或其中 a 是右值且 mp 是数据成员指针 (C++11 前);
- p->*mp,内建的指针的成员指针表达式,其中 mp 是成员函数指针[2];
- a, b,内建的逗号表达式,其中 b 是右值;
- a ? b : c,对某些 b 和 c 的三元条件表达式(细节见定义);
- 转换到非引用类型的转型表达式,例如 static_cast(x)、std::string{} 或 (int)42;
- this 指针;
- 枚举项;
- 非类型模板形参,除非它的类型是类或 (C++20 起)左值引用类型;
- lambda 表达式,例如 [](int x){ return x * x; };(C++11 起)
- requires 表达式,例如 requires (T i) { typename T::type; };(C++20 起)
- 概念的特化,例如 std::equality_comparable (C++20 起)
性质:
纯右值不具有多态:它所标识的对象的动态类型始终是该表达式的类型。
非类非数组的纯右值不能有 cv 限定,除非它被实质化以绑定到 cv 限定类型的引用 (C++17 起)。(注意:函数调用或转型表达式可能生成非类的 cv 限定类型的纯右值,但它的 cv 限定符通常被立即剥除。)
纯右值不能具有不完整类型(除了类型 void(见下文),或在 decltype 说明符中使用之外)
纯右值不能具有抽象类类型或它的数组类型。
易混:
++i是左值,i++是右值
前者,对i加1后再赋给i,最终的返回值就是i,所以,++i的结果是具名的,名字就是i;而对于i++而言,是先对i进行一次拷贝,将得到的副本作为返回结果,然后再对i加1,由于i++的结果是对i加1前i的一份拷贝,所以它是不具名的。
假设自增前i的值是6,那么,++i得到的结果是7,这个7有个名字,就是i;而i++得到的结果是6,这个6是i加1前的一个副本,它没有名字,i不是它的名字,i的值此时也是7。可见,++i和i++都达到了使i加1的目的,但两个表达式的结果不同。
解引用表达式 * p是左值,取地址表达式 &a 是纯右值。
&(*p) 一定是正确的,因为 *p得到的是p指向的实体,&( *p)得到的就是这一实体的地址,正是p的值。由于 &(*p)的正确,所以 *p是左值。而对&a而言,得到的是a的地址,相当于unsigned int型的字面值,所以是纯右值。
a+b、a&&b、ab 都是纯右值
a+b得到的是不具名的临时对象,而 a&&b 和 ab 的结果非 true 即 false,相当于字面值。
五.将亡值
在C++11之前的右值和C++11中的纯右值是等价的。C++11中的将亡值是随着右值引用的引入而新引入的。换言之,“将亡值”概念的产生,是由右值引用的产生而引起的,将亡值与右值引用息息相关。所谓的将亡值表达式,就是下列表达式:
- 返回右值引用的函数的调用表达式
- 转换为右值引用的转换函数的调用表达式
在C++11中,我们用左值去初始化一个对象或为一个已有对象赋值时,会调用拷贝构造函数或拷贝赋值运算符来拷贝资源(所谓资源,就是指new出来的东西),而当我们用一个右值(包括纯右值和将亡值)来初始化或赋值时,会调用移动构造函数或移动赋值运算符来移动资源,从而避免拷贝,提高效率。当该右值完成初始化或赋值的任务时,它的资源已经移动给了被初始化者或被赋值者,同时该右值也将会马上被销毁(析构)。
也就是说,当一个右值准备完成初始化或赋值任务时,它已经“将亡”了。而上面1)和2)两种表达式的结果都是不具名的右值引用,它们属于右值。
又因为
1)这种右值是与C++11新生事物——“右值引用”相关的“新右值”
2)这种右值常用来完成移动构造或移动赋值的特殊任务,扮演着“将亡”的角色,所以C++11给这类右值起了一个新的名字——将亡值。
下列表达式是将亡值表达式:
- 返回类型为对象的右值引用的函数调用或重载运算符表达式,例如 std::move(x);
- a[n],内建的下标表达式,它的操作数之一是数组右值;
- a.m,对象成员表达式,其中 a 是右值且 m 是非引用类型的非静态数据成员;
- a.*mp,对象的成员指针表达式,其中 a 是右值且 mp 是数据成员指针;
- a ? b : c,对某些 b 和 c 的三元条件表达式(细节见定义);
- 转换到对象的右值引用类型的转型表达式,例如 static_cast<char&&>(x);
- 在临时量实质化后,任何指代该临时对象的表达式。(C++17 起)
性质:
1.与右值相同。
2.与泛左值相同。
特别是,与所有的右值类似,亡值可以绑定到右值引用上,而且与所有的泛左值类似,亡值可以是多态的,而且非类的亡值可以有 cv 限定。
六.注意
1)字符串字面值是左值。
不是所有的字面值都是纯右值,字符串字面值是唯一例外。
早期C++将字符串字面值实现为char型数组,实实在在地为每个字符都分配了空间并且允许程序员对其进行操作,
cout<<&("abc")<<endl; const char *p_char="abc";//注意不是char *p_char=&("abc");
这样的代码都是可以编译通过的。
2)具名的右值引用是左值,不具名的右值引用是右值。
void foo(X&& x) { X anotherX = x; //后面还可以访问x }
上面X是自设计的类型,并且,其有一个指针成员p指向了在堆中分配的内存;参数x是X的右值引用。如果将x视为右值,那么,X another X = x;一句将调用X类的移动构造函数,而我们知道,这个移动构造函数的主要工作就是将x的p指针的值赋给anotherX的p指针,然后将x的p指针置为nullptr。而在后面,我们还可以访问x,也就是可以访问x.p,而此时x.p已经变成了nullptr,这就可能发生意想不到的错误。
3)注释
①只有当存在两个或两个以上的运算对象时才需要运算符连接,单独的运算对象也可以是表达式,例如上面提到的字面值和变量。
②确切说,是表达式的结果的值类别,但我们一般不刻意区分表达式和表达式的求值结果,所以这里称“表达式的值类别”。
③当我们将函数名作为一个值来使用时,该函数名自动转换为指向对应函数的指针。
④关于右值引用本身,没什么可说的,就是指可以绑定到右值上的引用,用"&&"表示,如int&&rra=6;。相比之下,与右值引用相关的一些主题,如移动语义、引用叠加、完美转发等,更值得我们深入探讨。这些内容,在下在后续文章中都会详细介绍。
⑤前提是该右值(如自定义的类X)有移动构造函数或移动赋值运算符可供调用(有时候是没有的,关于这些知识,后续文章在讲移动构造函数和移动赋值运算符时会详述)。
⑥在本文的例二中,如果将get_a_X()的返回值由X的右值引用改为X对象,则get_a_X()是纯右值表达式(如前所述,返回非引用类型的函数调用是纯右值),此时Foo(get_a_X());一句调用的仍然是类X的移动构造函数,这就是一个纯右值完成移动构造的例子。