提及用户体验研究的方法,大家都会脱口而出:定性与定量。
相比较定性研究中使用的那些五花八门各显神通的方法,定量研究似乎显得很单一,只有问卷法可用,而问卷调查法也似乎看上去并没有那么有技术含量,于是,许多刚刚接触到问卷法的小伙伴未免有这样的误解——问卷法真的是最简单的方法了呢~就是问出自己想问的问题就好啦!
事实上真的这样么?
同学,你真的是图样图森破啊~
用户研究,是想要知道用户在想什么,注重的是和用户的交流,但是问卷法调研大部分情况下,只有在发放问卷时和用户有沟通。在用户填答问卷过程中,作为研究者,一般是不参与整个过程的,那么就导致一个问题:当用户无法理解问卷在问什么或者不知道针对问题如何回答时,用户很可能就会放弃作答。于是,问卷的质量就成为了一次问卷调研能否成功的关键步骤。
什么样的问卷才是一份高质量的问卷呢?
NO.1 主题明确,紧扣调研的主题
每次制作调研问卷前,都需要确定目标——明确知道「我们要调研什么」、「我们要从哪几个方面调研」,之后所设计的问题,都必须是围绕调查目的最必要的题目,可要可不要的题目最好不要列入问题。
NO.2 问题的陈述要简洁、清楚,避免模糊信息
例如,某商场想要了解顾客大多使用什么品牌的洗发水,那么在询问这一问题时,应该如何设问呢?
错误示例:请问您使用什么牌子的洗发水呢?
正确示例:请问您最近三个月使用什么牌子的洗发水呢?
很明显,正确示例是一个清楚的问题,而错误示例则是一个附带了模糊信息的问题。另外,提醒大家,在询问中要避免专业术语哦。
NO.3 注意问题的严谨性
严谨性包括两个方面,一是指设问的严谨性,即一个问题只包含一项内容,再者还指所涉及的答案选项能包括被访者的所有情况。
错误示例一:对于XX牌洗发水的包装与味道,您是否喜欢呢?
错误示例二:使用XX后,你的XX问题是否得到了改善?A:没有 B:改善了
示例一的错误在于,一次询问了被访者两个问题,而示例二的错误在于,受访者可能没有使用过XX,这样就无法做出回答,所以应该再加一个「没有使用过XX」的选项。
NO.4 最好不用反疑问句,避免使用否定句
询问问题的方式要恰当,平白直叙的疑问句,能够获得受访者更直接的答案哦。
NO.5 避免使用引导性的语句
错误示例:大家都觉得XX很好,你觉得呢?
这样的问题很容易引起从众效应,可能受访者并不喜欢XX,但是看到题目里「大家都觉得XX好」,就会选择和大家一致的观点。类似的错误还包括权威效应。总之,一切具有暗示性和引导性的表达,都不应该出现在你的问卷里哦。
NO.6 注意问题的排序
一个问卷大多是由许多问题构成的,那么这些问题的排列也是有一定的讲究的。问卷项目的排列要有一定的逻辑次序,层次分明。一般而言,问卷的问题排列按照以下的标准:
熟悉问题在前,生疏问题在后;简单易答问题在前,复杂难答问题在后;泛指问题在前,特定问题在后;感兴趣的问题在前,顾虑紧张的问题在后;行为问题在前,态度问题在后;封闭式问题在前,开放式问题在后。
NO.7 注意问卷的长度
一个好的用户研究问卷,需要控制它的长度,超过20分钟答题时间,会让受访者感受到焦躁的情绪,从而放弃回答或者是随意填写,这样,我们问卷的有效性便要打个大大的折扣。
小编总结了一下综上观点,其实就是:主题明确,提问科学,排列有序,容量适度。
总而言之,记住十六字真言,编制出一份优秀的问卷吧。
问卷调研是用户研究中的重要方法,除了研究者自己来编制问卷之外,还可以直接使用成型的标准化问卷。由于标准化问卷是对特定问题的测量,所以,问卷标准化的前提是,这一问题有着稳定的内核,为了方便大家更好的理解,我们将从可用性问卷这一分支,为大家介绍标准化问卷。
什么是标准化问卷
标准化问卷是对特定问题使用特定的格式按照特定的顺序呈现的可重复使用问卷,对于用户的回答,也有特定的计算方法和规则。简单而言,标准化问卷是对某一特定问题的重复使用问卷。
那么,如果我编写一份问卷来收集用户的满意度反馈,这份问卷每个月都用,这份问卷能称为标准化问卷么?答案是否定的。为了保证标准化问卷能够满足重复使用的需求,问卷需要经过心理测量的条件审查:提供问卷的信度和效度。
● 信度——测量一致性。它衡量的指标是:对同一对象测量得到的结果是否一致。一般信度的评估包括重复测量信度和分半信度,最常见的方法是用 α 系数来测量内部一致性。信度范围在 0 到 1 之间,对于问卷的信度,并没有固定的要求,不同内容的问卷对信度的要求不一样,但是,那些有着重要影响的问卷,例如 IQ 测试等,我们对其信度要求高,一般达到 0.9 以上,而一些其他的问卷,信度要求 0.7 以上就能够接受
● 效度——测量有效性。它衡量着问卷是否有效的测量了所要关注的问题。一般效度评估包括效标效度和内容效度。效标效度一般用皮尔逊相关来测量,而内容效度则需要使用因子分析。
信度和效度是有明确指数的,除此之外,还有一些其他的间接的辅助值来衡量一份标准化问卷的质量。例如灵敏度——不同条件结果比较时达到统计显著性所需的最小样本量。
信度和效度是有明确指数的,除此之外,还有一些其他的间接的辅助值来衡量一份标准化问卷的质量。例如灵敏度——不同条件结果比较时达到统计显著性所需的最小样本量。
正是因为有这些标准来规范标准化问卷,使得标准化问卷在研究中有着非常明显的优点:
● 客观性:标准化测量具有客观性,它允许我们独立验证其他研究者的测量报告,也就是说,在完全同样的条件下,使用者A和使用者B使用问卷得出的结果是一致的,他不受使用者主观意愿的影响,结果不仅是使用者的个人判断。
● 重复性:使用标准化问卷可重复别人或者自己的研究,这样,可以验证研究是否真正有效。更重要的是,节省研究者时间。
● 可量化:可以使用高效的统计学方法来更好的理解结果,并且结果之间可以进行对比,从数据的角度看到差别
由此可见,一份标准化问卷的开发需要大量的专业人员花费大量的时间和精力,但是,一旦开发成型,能给使用者带来很大的方便。
由此可见,一份标准化问卷的开发需要大量的专业人员花费大量的时间和精力,但是,一旦开发成型,能给使用者带来很大的方便。
广泛应用的标准化可用性问卷
用户体验是近些年大热的概念,可用性的概念也随着互联网的发展变得众所周知,不过,关于可用性的研究,可不是最近才有的哦,上世纪 90 年代,就陆续出现了许多标准化的可用性问卷。这些问卷既有用于整体研究后的,也有用于每个任务后的。接下来,跟大家介绍一个问卷实例:SUS (软件可用性问卷)——整体评估问卷。
之所以在众多整体评估问卷中选择了这个问卷来介绍,是因为这个问卷有非常多的优点,最主要的包括:1.相关介绍多 2.题少 3.免费!!!特别是免费,要知道,跟商业使用费 750 刀(对,没写错……)的 QUIS (用户交互满意度问卷)和 500 欧的 SUMI (软件可用性测试问卷)相比,免费的 SUS 真是,太可爱了!
SUS 问卷历史悠久,作者 John Brooke 在 1986 年正式将其发表,问卷一共有 10 道题目,采用 5 分制,包含正面描述题 5 道(1、3、5、7、9题),和反面描述题5道(2、4、6、8、10),来询问用户对表述是否认同,具体题目如下:
中文版翻译之后为:
我愿意使用这个系统
我发现这个系统过于复杂
我认为这个系统用起来很容易
我认为我需要专业人员的帮助才能使用这个系统
我发现系统里的各项产品很好地整合在一起了
我认为系统中存在大量的不一致
我能想象大部分人都能快速学会使用该系统
为认为这个系统使用起来很麻烦
使用这个系统时我觉得非常有信心
在使用这个系统之前我需要大量的学习
我发现这个系统过于复杂
我认为这个系统用起来很容易
我认为我需要专业人员的帮助才能使用这个系统
我发现系统里的各项产品很好地整合在一起了
我认为系统中存在大量的不一致
我能想象大部分人都能快速学会使用该系统
为认为这个系统使用起来很麻烦
使用这个系统时我觉得非常有信心
在使用这个系统之前我需要大量的学习
如果用户没有完成某道题目,则视为选择中间项。
问卷看似简单,但是,问卷的信度可不低哦,连编制者都自嘲「快速而粗糙」的 SUS 量表在较大样本(324个样本)情况下信度达到 0.92。所以,不用担心这一问卷的可靠程度。
回收问卷后,要对该问卷进行计算,该问卷是 5 分制分布,但是计算方式略为复杂,它是一个满分为 100 分的问卷。具体算法为:
计算正面描述题(奇数题)得分:转换分=选项值 – 1
计算反面描述题(偶数题)得分:转换分=5 – 选项分
计算总分:总分=所有转换分之和×2.5
计算反面描述题(偶数题)得分:转换分=5 – 选项分
计算总分:总分=所有转换分之和×2.5
这样,最终的计算结果就是一个介于 0 至 100 的数字。100 表示用户体验最佳,0 表示用户体验最差。具体值代表什么一直有争议,直到 2009 年,Bangor 等人通过分级量表对得分进行了解释:0-50 为”F”,60-69 为”D”,70-79 为”C”,80-89 为”B”,90 以上为”A”,每个分数有其对应的等级。一般而言,低于 60 分,说明产品的可用性非常差。
这样,利用可用性测试问卷,我们就可以了解一个产品的可用性程度,并对不同产品间进行对比。