品質の破綻#
「品質とは行為ではなく、習慣である」 ——アリストテレス
ボルトが1本緩んでいるのは保守の問題だ。100本緩んでいるのは構造的な欠陥だ。この二つの違いは複雑さではない——一貫性だ。正確に言えば、一貫性の欠如だ。
品質システムが存在する理由はたった一つ。正しいことが毎回行われるようにすること。誰かが見ているときだけでなく、条件が完璧なときだけでなく、毎回。このシステムが崩れ始めると——例外が日常になり、近道が標準手順になり、「まあいいだろう」が「正確に」に取って代わると——組織はすぐには気づかない。品質の浸食は静かだ。プロセスの文書に書かれていることと、人々が実際にやっていることの隙間で、じわじわと蓄積される。
この章では、品質の破綻で命を落とした3つの会社を取り上げる。どの会社も、単一の壊滅的な欠陥があったわけではない。どの会社にも、千もの小さな欠陥があった。
ケース1:Meridian Foods——標準になった近道#
成長#
Janet Rawlingsは2006年、テネシー州ナッシュビルにMeridian Foodsを設立した。高級スーパーマーケット向けにアーティザナルソース、マリネ液、ドレッシングを製造していた。Rawlingsは元シェフで食品科学の学位を持ち、原材料の品質と生産基準へのこだわりは偏執的と言えるほどだった。製品は業界賞を複数受賞し、南東部の高級食料品チェーンの棚に並んだ。
2013年までにMeridianは売上1600万ドル、従業員85名に成長した。工場はRawlings自身が設計した専用施設で、FDAの要件を上回る基準だった。すべてのバッチが検査された。すべての原材料が産地まで追跡できた。Meridianにおいて品質は一部門ではなかった——それは会社のアイデンティティだった。
衰退#
成長が圧力を生んだ。2014年、Meridianは全国展開するオーガニック食料品チェーンとの契約を獲得し、生産量は倍増することになった。Rawlingsは生産ラインを拡張し、3ヶ月で40名の新規従業員を採用した。
採用が速すぎた。以前は2週間かけてベテランスタッフがマンツーマンで指導していた研修が、3日間の座学に圧縮された。新しい従業員は手順を覚えたが、その背後にある理由は学ばなかった。何をすべきかは知っていたが、なぜそうするのかは分からなかった。
数ヶ月で近道が現れた。温度記録はチェックポイントごとではなく、シフト終了時にまとめて記入されるようになった。デジタルスケールが別のラインで使われているときは、原材料の計量を目分量で済ませた。残業時のクリーニングプロトコルは短縮された。一つひとつの逸脱は小さかった。生産目標を達成しようとする作業員の視点からは、どれも合理的だった。
Rawlingsは事業拡大に追われ、毎日生産現場に出ることがなくなっていた。品質管理者がメモで研修のギャップを指摘した。Rawlingsはそれを読んで脇に置いた。「この成長フェーズを乗り越えたら引き締めよう」と言った。
2016年、Meridianの看板商品であるチポトレソースのあるバッチが、定期的な小売検査でリステリア菌陽性と判定された。調査の結果、汚染は数ヶ月にわたって断続的に発生していたクリーニングプロトコルの不備に起因していた。リコールは7州にわたる4万個に及んだ。
食料品チェーンは契約を打ち切った。他の3つの小売業者も予防措置としてMeridian製品を棚から撤去した。リコール費用は280万ドル——年間利益を上回る額だった。Rawlingsは再建を試みたが、プレミアム食品の世界では信頼が商品そのものだ。信頼を失えば、ビジネスも失う。Meridianは2017年に閉鎖した。
教訓#
品質システムは自動では動かない。手順だけでなく、各手順の目的を理解した訓練された人材が必要だ。成長が研修を追い越すと、手順は紙の上に残ったまま実際の運用がドリフトしていく。Rawlingsは優れたシステムを構築し、そのシステムがなぜ存在するのかを理解していない人材で運用した。汚染は事故でも不正でもなかった。設計されたシステムと実践されているシステムの間のギャップだった——Rawlingsが成長に注意を奪われて拡大を許したギャップだ。
ケース2:Apex Fabrication——忍び寄る公差のドリフト#
成長#
Paul Drummondは2001年、カンザス州ウィチタにApex Fabricationを設立した。航空宇宙・防衛サプライチェーン向けの精密金属部品を製造していた。2005年にAS9100認証——航空宇宙品質規格——を取得し、Tier 2・Tier 3の航空宇宙サプライヤーを顧客基盤として着実に拡大した。2012年までに売上2800万ドル、利益率18%に達した。
Drummondの工場は精度で勝負していた。公差は千分の一インチ単位で測定された。すべての部品が検査された。不良率は毎日追跡された。Apexの品質実績は最強の営業ツールだった——航空宇宙では一つの欠陥部品が航空機を地上に留めることがあり、バイヤーはゼロ欠陥部品を安定供給できる実績のあるサプライヤーを選ぶ。
衰退#
浸食は2013年、当時は合理的に見えた判断から始まった。大口顧客からリードタイム短縮の圧力を受け、Drummondは一部の非重要部品について100%検査から統計的サンプリングへの移行を承認した。サンプリング計画は品質規格の技術的要件を満たしていた。書面上は正当化できた。
だが、それは文化の中の何か根本的なものを変えた。
100%検査の下では、すべての機械工が自分の作ったすべての部品が検査されることを知っていた。検査は品質ゲートであるだけでなく、シグナルだった。「すべての一個が重要だ」というシグナルだ。統計的サンプリングは異なるメッセージを送った。「ほとんどの部品は重要だが、すべてではない。」
行動の変化は徐々に進んだ。以前は検査に出す前に自分でダブルチェックしていた機械工が、それほど注意深くなくなった。セットアップ検証——フルバッチを走らせる前に機械が公差内の部品を生産しているか確認する工程——が省略されることがあった。「どうせサンプリングだから」が暗黙の言い訳になった。
Drummondはこの変化に気づかなかった。指標は問題ないように見えたからだ。サンプリング計画は設計上、一定割合の欠陥しか捕捉しない。不良率は安定して見えた。だが実際の欠陥率——100%検査なら見えていたはずの数字——は上昇していた。
2015年、Apexが製造した油圧バルブハウジングのバッチが航空機システムに組み込まれ、テスト中に故障した。調査の結果、バッチ40個のうち3個のボア径が公差外であることが判明した。サンプリング計画の下で、その3個は検査されていなかった。
顧客はApexに100%検査への復帰を要求した——費用はApex負担で。他の2社の顧客も事態を知って独自に監査を行い、自社の注文にも同様の公差ドリフトを発見した。6ヶ月以内に、Apexは売上の40%に相当する契約を失った。全数検査復帰のコストと売上減少が重なり、事業の継続が不可能になった。2016年、Apexは設備の価値で競合他社に売却された。
教訓#
品質基準は単なる技術仕様ではない。それは行動のアーキテクチャだ。Apexが100%検査からサンプリングに移行したとき、変わったのはプロセスだけではなかった——精度がどれほど重要かについて、組織が人々に送るメッセージが変わった。公差のドリフトは機械で起きたのではない。文化の中で起きた。そして精密さの文化が一度緩むと、復元には旧プロセスの復活だけでは足りない。そのプロセスを機能させていた信念体系そのものを再構築する必要がある。
ケース3:Clearview Software——誰も実行しなかったテストスイート#
成長#
Nina ParkとJames Alcottは元エンタープライズソフトウェア開発者で、2008年にテキサス州オースティンにClearview Softwareを設立した。中堅卸売業者向けの在庫管理システムを開発していた。製品は派手ではなかった——安定していて、ドキュメントが整っていて、約束通りのことをきちんとやる。過剰な約束をする競合がひしめく業界で、それは本物の競争優位だった。
2014年までに、Clearviewは340のクライアント、年間経常収益1200万ドル、22名のエンジニアリングチームを擁していた。コードベースはクリーンだった。自動テストスイート——コード変更のたびにソフトウェアの機能を検証する包括的なチェックセット——が毎晩実行され、欠陥が顧客に届く前に検出していた。フィールドからのバグレポートは月平均5件未満だった。
衰退#
Parkは2015年に別のプロジェクトに移り、Alcottが単独で指揮を執った。才能ある開発者だが、せっかちなマネージャーだった。彼の優先事項はフィーチャーの投入速度——資金力のある大手競合に追いつくために、新機能を速く出荷すること。
テストスイートがボトルネックになった。実行に4時間かかる。失敗を報告すると、開発者はそれが本物のバグなのか、テスト自体の更新が必要なのかを調査しなければならない。それには時間がかかる。Alcottはチームに、デプロイ前に毎回フルスイートを実行するのではなく、「どのテストを実行するか自分で判断せよ」と言い始めた。
1年以内に、フルスイートは毎晩から毎週の実行になった。2年以内には月次になり——しかも失敗が頻繁すぎてほぼ無視されるようになった。「既知の問題」とチームは呼んだ。かつて会社の品質の背骨だったテストスイートは、バックグラウンドノイズになった。
影響はゆっくりと忍び込んだ。ソフトウェアアップデートが微妙なバグを持ち込み始めた——在庫計算の丸め誤差、タイムゾーン処理の不具合。一つひとつは小さかった。サポートチームがパッチで対応した。だがパッチの頻度は月5件から15件、そして30件に増えた。そして各パッチ自体がフルスイートでテストされていないため、別の問題を引き起こすリスクがあった。
2018年、定例のソフトウェアアップデートが23のクライアントの在庫データベースを同時に破損した。バグはレースコンディション——テストスイートがまさに検出するよう設計されていた種類の欠陥だった。フルスイートが実行されていれば、デプロイ前に問題を検出していたはずだ。
データ破損の修復には数週間を要した。11のクライアントが事業中断で訴訟を起こした。法的費用と和解金は合計420万ドル。さらに深刻だったのは評判の崩壊だ。Clearviewのセールスポイントは信頼性そのものであり、大規模なデータ破損事件がそのポジショニングを一夜にして粉砕した。顧客離反率は年間30%に加速した。2019年、Clearviewはピーク時の評価額のごく一部の価格で競合他社に買収された。
教訓#
品質インフラ——テストスイート、検査プロトコル、監査プロセス——はオーバーヘッドではない。「起きていると思っていること」と「実際に起きていること」の差を管理可能な範囲に収めるメカニズムだ。Clearviewがテストの実行を止めたとき、すぐに品質の悪いソフトウェアが生まれたわけではない。検証できなくなったソフトウェアが生まれた。品質は問題なかったかもしれない。問題は、誰にも分からなかったということだ——そして品質に問題があったとき、それを見つけたのは顧客だった。
診断パターン#
品質の破綻は一貫した弧を描く。
フェーズ1:プロセスの完全性。 品質システムが設計通りに機能している。手順が執行され、理解され、文化的に重んじられているから、人々はそれに従う。欠陥は早期に発見される。組織は、意図した生産物と実際の生産物のギャップを把握している。
フェーズ2:圧力の導入。 成長、コスト圧力、競争の緊迫感が、品質プロセスとスピードの間に緊張を生む。組織は選択を迫られる——品質システムを事業と並行してスケールさせるか、圧力に対応するためにシステムを緩めるか。
フェーズ3:選択的な緩和。 組織は合理的な理由をつけて、特定の品質管理を緩める——検査頻度、テストの厳格さ、研修の深さ。一つひとつの緩和は個別に見れば正当化できる。しかし全体として、紙の上のシステムと実際のシステムのギャップを広げていく。
フェーズ4:ドリフトの正常化。 緩和された基準が新たなベースラインになる。元の基準が何だったか、人々は忘れる。新しい現実に再較正された指標は「許容範囲内」と表示する。組織は品質に問題がないと信じている——なぜなら「問題ない」の定義を静かに引き下げたからだ。
フェーズ5:故障の顕在化。 品質の故障が顧客に——あるいは規制当局に、あるいは社会に——到達する。組織は、実際の品質レベルが信じていたよりもはるかに低いことを発見し、そのギャップは急速には埋められないほど大きい。財務的、法的、評判上のダメージが組織の吸収能力を超える。
一貫した教訓:品質は状態ではない。規律だ。それを生み出すシステムが維持され、執行され、大切にされている限りにおいてのみ存在する。組織が品質インフラをオプション扱いし始めた瞬間——先送りできる、省略できる、選択的に適用できるものとして扱い始めた瞬間——失敗へのカウントダウンは始まっている。変数は導火線の長さだけだ。