Blame - lib/ReplacePointerBitcastPass.cpp - chromium.googlesource.com/chromiumos/third_party/clspv

blob: 7415fae8998038a591751cb712c7b11f86737e7e [file] [log] [blame]

David Neto	22f144c	2017-06-12 14:26:21 -0400	[diff] [blame]	1	// Copyright 2017 The Clspv Authors. All rights reserved.
				2	//
				3	// Licensed under the Apache License, Version 2.0 (the "License");
				4	// you may not use this file except in compliance with the License.
				5	// You may obtain a copy of the License at
				6	//
				7	// http://www.apache.org/licenses/LICENSE-2.0
				8	//
				9	// Unless required by applicable law or agreed to in writing, software
				10	// distributed under the License is distributed on an "AS IS" BASIS,
				11	// WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
				12	// See the License for the specific language governing permissions and
				13	// limitations under the License.
				14
David Neto	118188e	2018-08-24 11:27:54 -0400	[diff] [blame]	15	#include "llvm/IR/DataLayout.h"
				16	#include "llvm/IR/IRBuilder.h"
				17	#include "llvm/IR/Instructions.h"
				18	#include "llvm/IR/Module.h"
				19	#include "llvm/Pass.h"
				20	#include "llvm/Support/raw_ostream.h"
David Neto	22f144c	2017-06-12 14:26:21 -0400	[diff] [blame]	21
Diego Novillo	a4c44fa	2019-04-11 10:56:15 -0400	[diff] [blame]	22	#include "Passes.h"
				23
David Neto	22f144c	2017-06-12 14:26:21 -0400	[diff] [blame]	24	using namespace llvm;
				25
				26	#define DEBUG_TYPE "replacepointerbitcast"
				27
				28	namespace {
				29	struct ReplacePointerBitcastPass : public ModulePass {
				30	static char ID;
				31	ReplacePointerBitcastPass() : ModulePass(ID) {}
				32
David Neto	30ae05e	2017-09-06 19:58:36 -0400	[diff] [blame]	33	// Returns the number of chunks of source data required to exactly
				34	// cover the destination data, if the source and destination types are
				35	// different sizes. Otherwise returns 0.
David Neto	22f144c	2017-06-12 14:26:21 -0400	[diff] [blame]	36	unsigned CalculateNumIter(unsigned SrcTyBitWidth, unsigned DstTyBitWidth);
				37	Value *CalculateNewGEPIdx(unsigned SrcTyBitWidth, unsigned DstTyBitWidth,
Diego Novillo	3cc8d7a	2019-04-10 13:30:34 -0400	[diff] [blame]	38	GetElementPtrInst *GEP);
David Neto	22f144c	2017-06-12 14:26:21 -0400	[diff] [blame]	39
				40	bool runOnModule(Module &M) override;
				41	};
Diego Novillo	3cc8d7a	2019-04-10 13:30:34 -0400	[diff] [blame]	42	} // namespace
David Neto	22f144c	2017-06-12 14:26:21 -0400	[diff] [blame]	43
				44	char ReplacePointerBitcastPass::ID = 0;
Diego Novillo	a4c44fa	2019-04-11 10:56:15 -0400	[diff] [blame]	45	INITIALIZE_PASS(ReplacePointerBitcastPass, "ReplacePointerBitcast",
				46	"Replace Pointer Bitcast Pass", false, false)
David Neto	22f144c	2017-06-12 14:26:21 -0400	[diff] [blame]	47
				48	namespace clspv {
				49	ModulePass *createReplacePointerBitcastPass() {
				50	return new ReplacePointerBitcastPass();
				51	}
Diego Novillo	3cc8d7a	2019-04-10 13:30:34 -0400	[diff] [blame]	52	} // namespace clspv
David Neto	22f144c	2017-06-12 14:26:21 -0400	[diff] [blame]	53
alan-baker	3201427	2019-05-22 08:07:18 -0400	[diff] [blame]	54	namespace {
				55
				56	// Gathers the scalar values of \|v\| into \|elements\|. Generates new instructions
				57	// to extract the values.
				58	void GatherBaseElements(Value v, SmallVectorImpl<Value > *elements,
				59	IRBuilder<> &builder) {
				60	auto *module = builder.GetInsertBlock()->getParent()->getParent();
				61	auto &DL = module->getDataLayout();
				62	auto *type = v->getType();
				63	if (auto *vec_type = dyn_cast<VectorType>(type)) {
				64	for (uint64_t i = 0; i != vec_type->getNumElements(); ++i) {
				65	elements->push_back(builder.CreateExtractElement(v, i));
				66	}
				67	} else if (auto *array_type = dyn_cast<ArrayType>(type)) {
				68	for (uint64_t i = 0; i != array_type->getNumElements(); ++i) {
				69	auto *extract = builder.CreateExtractValue(v, {static_cast<unsigned>(i)});
				70	GatherBaseElements(extract, elements, builder);
				71	}
				72	} else if (auto *struct_type = dyn_cast<StructType>(type)) {
				73	const auto *struct_layout = DL.getStructLayout(struct_type);
				74	if (struct_layout->hasPadding()) {
				75	llvm_unreachable("Unhandled conversion of padded struct");
				76	}
				77	for (unsigned i = 0; i != struct_type->getNumElements(); ++i) {
				78	auto *extract = builder.CreateExtractValue(v, {i});
				79	GatherBaseElements(extract, elements, builder);
				80	}
				81	} else {
				82	elements->push_back(v);
				83	}
				84	}
				85
				86	// Returns a value of \|dst_type\| using the elemental members of \|src_elements\|.
				87	Value BuildFromElements(Type dst_type, const ArrayRef<Value *> &src_elements,
				88	unsigned used_bits, unsigned index,
				89	IRBuilder<> &builder) {
				90	auto *module = builder.GetInsertBlock()->getParent()->getParent();
				91	auto &DL = module->getDataLayout();
				92	auto &context = dst_type->getContext();
				93	Value *dst = nullptr;
				94	// Arrays, vectors and structs are annoyingly just different enough to each
				95	// require their own cases.
				96	if (auto *dst_array_ty = dyn_cast<ArrayType>(dst_type)) {
				97	auto *ele_ty = dst_array_ty->getElementType();
				98	for (uint64_t i = 0; i != dst_array_ty->getNumElements(); ++i) {
				99	auto *tmp_value =
				100	BuildFromElements(ele_ty, src_elements, used_bits, index, builder);
				101	auto *prev = dst ? dst : UndefValue::get(dst_type);
				102	dst = builder.CreateInsertValue(prev, tmp_value,
				103	{static_cast<unsigned>(i)});
				104	}
				105	} else if (auto *dst_struct_ty = dyn_cast<StructType>(dst_type)) {
				106	const auto *struct_layout = DL.getStructLayout(dst_struct_ty);
				107	if (struct_layout->hasPadding()) {
				108	llvm_unreachable("Unhandled padded struct conversion");
				109	return nullptr;
				110	}
				111	for (unsigned i = 0; i != dst_struct_ty->getNumElements(); ++i) {
				112	auto *ele_ty = dst_struct_ty->getElementType(i);
				113	auto *tmp_value =
				114	BuildFromElements(ele_ty, src_elements, used_bits, index, builder);
				115	auto *prev = dst ? dst : UndefValue::get(dst_type);
				116	dst = builder.CreateInsertValue(prev, tmp_value, {i});
				117	}
				118	} else if (auto *dst_vec_ty = dyn_cast<VectorType>(dst_type)) {
				119	auto *ele_ty = dst_vec_ty->getElementType();
				120	for (uint64_t i = 0; i != dst_vec_ty->getNumElements(); ++i) {
				121	auto *tmp_value =
				122	BuildFromElements(ele_ty, src_elements, used_bits, index, builder);
				123	auto *prev = dst ? dst : UndefValue::get(dst_type);
				124	dst = builder.CreateInsertElement(prev, tmp_value, i);
				125	}
				126	} else {
				127	// Scalar conversion eats up elements in src_elements.
				128	auto dst_width = DL.getTypeStoreSizeInBits(dst_type);
				129	uint64_t bits = 0;
				130	Value *tmp_value = nullptr;
				131	auto prev_bits = 0;
				132	Value *ele_int_cast = nullptr;
				133	while (bits < dst_width) {
				134	prev_bits = bits;
				135	auto ele = src_elements[index];
				136	auto *ele_ty = ele->getType();
				137	auto ele_width = DL.getTypeStoreSizeInBits(ele_ty);
				138	auto remaining_bits = ele_width - *used_bits;
				139	auto needed_bits = dst_width - bits;
				140	// Create a reusable cast to an integer type for this element.
				141	if (!ele_int_cast \|\| cast<User>(ele_int_cast)->getOperand(0) != ele) {
				142	ele_int_cast =
				143	builder.CreateBitCast(ele, IntegerType::get(context, ele_width));
				144	}
				145	tmp_value = ele_int_cast;
				146	// Some of the bits of this element were previously used, so shift the
				147	// value that many bits.
				148	if (*used_bits != 0) {
				149	tmp_value = builder.CreateLShr(tmp_value, *used_bits);
				150	}
				151	if (needed_bits < remaining_bits) {
				152	// Ensure only the needed bits are used.
				153	uint64_t mask = (1ull << needed_bits) - 1;
				154	tmp_value =
				155	builder.CreateAnd(tmp_value, builder.getIntN(dst_width, mask));
				156	}
				157	// Cast to tbe destination bit width, but stay as a integer type.
				158	if (ele_width != dst_width) {
				159	tmp_value = builder.CreateIntCast(
				160	tmp_value, IntegerType::get(context, dst_width), false);
				161	}
				162
				163	if (remaining_bits <= needed_bits) {
				164	// Used the rest of the element.
				165	*used_bits = 0;
				166	++(*index);
				167	bits += remaining_bits;
				168	} else {
				169	// Only need part of this element.
				170	*used_bits += needed_bits;
				171	bits += needed_bits;
				172	}
				173
				174	if (dst) {
				175	// Previous iteration generated an integer of the right size. That needs
				176	// to be combined with the value generated this iteration.
				177	tmp_value = builder.CreateShl(tmp_value, prev_bits);
				178	dst = builder.CreateOr(dst, tmp_value);
				179	} else {
				180	dst = tmp_value;
				181	}
				182	}
				183
				184	assert(bits <= dst_width);
				185	if (bits == dst_width && dst_type != dst->getType()) {
				186	// Finally, cast away from the working integer type if necessary.
				187	dst = builder.CreateBitCast(dst, dst_type);
				188	}
				189	}
				190
				191	return dst;
				192	}
				193
				194	// Returns an equivalent value of \|src\| as \|dst_type\|.
				195	//
				196	// This function requires \|src\|'s and \|dst_type\|'s bit widths match. Does not
				197	// introduce new integer sizes, but generates multiple instructions to mimic a
				198	// generic bitcast (unless a bitcast is sufficient).
				199	Value ConvertValue(Value src, Type *dst_type, IRBuilder<> &builder) {
				200	auto *src_type = src->getType();
				201	auto *module = builder.GetInsertBlock()->getParent()->getParent();
				202	auto &DL = module->getDataLayout();
				203	if (!src_type->isFirstClassType() \|\| !dst_type->isFirstClassType() \|\|
				204	src_type->isAggregateType() \|\| dst_type->isAggregateType()) {
				205	SmallVector<Value *, 8> src_elements;
				206	if (src_type->isAggregateType()) {
				207	GatherBaseElements(src, &src_elements, builder);
				208	} else {
				209	src_elements.push_back(src);
				210	}
				211
				212	// Check that overall sizes make sense.
				213	uint64_t element_sum = 0;
				214	// Can only successfully convert unpadded structs.
				215	for (auto element : src_elements) {
				216	element_sum += DL.getTypeStoreSizeInBits(element->getType());
				217	}
				218	if (DL.getTypeStoreSizeInBits(dst_type) != element_sum) {
				219	llvm_unreachable("Elements do not sum to overall size");
				220	return nullptr;
				221	}
				222
				223	unsigned used_bits = 0;
				224	unsigned index = 0;
				225	return BuildFromElements(dst_type, src_elements, &used_bits, &index,
				226	builder);
				227	} else {
				228	return builder.CreateBitCast(src, dst_type);
				229	}
				230
				231	return nullptr;
				232	}
				233
				234	} // namespace
				235
David Neto	22f144c	2017-06-12 14:26:21 -0400	[diff] [blame]	236	unsigned ReplacePointerBitcastPass::CalculateNumIter(unsigned SrcTyBitWidth,
				237	unsigned DstTyBitWidth) {
				238	unsigned NumIter = 0;
				239	if (SrcTyBitWidth > DstTyBitWidth) {
				240	if (SrcTyBitWidth % DstTyBitWidth) {
				241	llvm_unreachable(
				242	"Src type bitwidth should be multiple of Dest type bitwidth");
				243	}
				244	NumIter = 1;
				245	} else if (SrcTyBitWidth < DstTyBitWidth) {
				246	if (DstTyBitWidth % SrcTyBitWidth) {
				247	llvm_unreachable(
				248	"Dest type bitwidth should be multiple of Src type bitwidth");
				249	}
				250	NumIter = DstTyBitWidth / SrcTyBitWidth;
				251	} else {
				252	NumIter = 0;
				253	}
				254
				255	return NumIter;
				256	}
				257
Diego Novillo	3cc8d7a	2019-04-10 13:30:34 -0400	[diff] [blame]	258	Value *ReplacePointerBitcastPass::CalculateNewGEPIdx(unsigned SrcTyBitWidth,
				259	unsigned DstTyBitWidth,
				260	GetElementPtrInst *GEP) {
David Neto	22f144c	2017-06-12 14:26:21 -0400	[diff] [blame]	261	Value *NewGEPIdx = GEP->getOperand(1);
				262	IRBuilder<> Builder(GEP);
				263
				264	if (SrcTyBitWidth > DstTyBitWidth) {
				265	if (GEP->getNumOperands() > 2) {
				266	GEP->print(errs());
				267	llvm_unreachable("Support above GEP on PointerBitcastPass");
				268	}
				269
				270	NewGEPIdx = Builder.CreateLShr(
Diego Novillo	3cc8d7a	2019-04-10 13:30:34 -0400	[diff] [blame]	271	NewGEPIdx, Builder.getInt32(std::log2(SrcTyBitWidth / DstTyBitWidth)));
David Neto	22f144c	2017-06-12 14:26:21 -0400	[diff] [blame]	272	} else if (DstTyBitWidth > SrcTyBitWidth) {
				273	if (GEP->getNumOperands() > 2) {
				274	GEP->print(errs());
				275	llvm_unreachable("Support above GEP on PointerBitcastPass");
				276	}
				277
				278	NewGEPIdx = Builder.CreateShl(
Diego Novillo	3cc8d7a	2019-04-10 13:30:34 -0400	[diff] [blame]	279	NewGEPIdx, Builder.getInt32(std::log2(DstTyBitWidth / SrcTyBitWidth)));
David Neto	22f144c	2017-06-12 14:26:21 -0400	[diff] [blame]	280	}
				281
				282	return NewGEPIdx;
				283	}
				284
				285	bool ReplacePointerBitcastPass::runOnModule(Module &M) {
				286	bool Changed = false;
				287
Diego Novillo	3cc8d7a	2019-04-10 13:30:34 -0400	[diff] [blame]	288	const DataLayout &DL = M.getDataLayout();
David Neto	8e13814	2018-05-29 10:19:21 -0400	[diff] [blame]	289
David Neto	22f144c	2017-06-12 14:26:21 -0400	[diff] [blame]	290	SmallVector<Instruction *, 16> VectorWorkList;
				291	SmallVector<Instruction *, 16> ScalarWorkList;
alan-baker	1b13e8f	2019-08-08 17:56:51 -0400	[diff] [blame]	292	SmallVector<User *, 16> UserWorkList;
David Neto	22f144c	2017-06-12 14:26:21 -0400	[diff] [blame]	293	for (Function &F : M) {
				294	for (BasicBlock &BB : F) {
				295	for (Instruction &I : BB) {
				296	// Find pointer bitcast instruction.
				297	if (isa<BitCastInst>(&I) && isa<PointerType>(I.getType())) {
				298	Value *Src = I.getOperand(0);
				299	if (isa<PointerType>(Src->getType())) {
alan-baker	1b13e8f	2019-08-08 17:56:51 -0400	[diff] [blame]	300	// Check if this bitcast is one that can be handled during this run
				301	// of the pass. If not, just skip it and don't make changes to the
				302	// module. These checks are coarse level checks that only the right
				303	// instructions appear. Rejected bitcasts might be able to be
				304	// handled later in the flow after further optimization.
				305	UserWorkList.clear();
				306	for (auto User : I.users()) {
				307	UserWorkList.push_back(User);
				308	}
				309	bool ok = true;
				310	while (!UserWorkList.empty()) {
				311	auto User = UserWorkList.back();
				312	UserWorkList.pop_back();
				313
				314	if (isa<GetElementPtrInst>(User)) {
				315	for (auto GEPUser : User->users()) {
				316	UserWorkList.push_back(GEPUser);
				317	}
				318	} else if (!isa<StoreInst>(User) && !isa<LoadInst>(User)) {
				319	// Cannot handle this bitcast.
				320	ok = false;
				321	break;
				322	}
				323	}
				324	if (!ok) {
				325	continue;
				326	}
				327
David Neto	22f144c	2017-06-12 14:26:21 -0400	[diff] [blame]	328	Type *SrcEleTy =
				329	I.getOperand(0)->getType()->getPointerElementType();
				330	Type *DstEleTy = I.getType()->getPointerElementType();
				331	if (SrcEleTy->isVectorTy() \|\| DstEleTy->isVectorTy()) {
				332	// Handle case either operand is vector type like char4* -> int4*.
				333	VectorWorkList.push_back(&I);
				334	} else {
				335	// Handle case all operands are scalar type like char* -> int*.
				336	ScalarWorkList.push_back(&I);
				337	}
				338
				339	Changed = true;
				340	} else {
				341	llvm_unreachable("Unsupported bitcast");
				342	}
				343	}
				344	}
				345	}
				346	}
				347
				348	SmallVector<Instruction *, 16> ToBeDeleted;
				349	for (Instruction *Inst : VectorWorkList) {
				350	Value *Src = Inst->getOperand(0);
				351	Type *SrcTy = Src->getType()->getPointerElementType();
				352	Type *DstTy = Inst->getType()->getPointerElementType();
				353	Type *SrcEleTy =
alan-baker	8eb435a	2020-04-08 00:42:06 -0400	[diff] [blame]	354	SrcTy->isVectorTy() ? SrcTy->getVectorElementType() : SrcTy;
David Neto	22f144c	2017-06-12 14:26:21 -0400	[diff] [blame]	355	Type *DstEleTy =
alan-baker	8eb435a	2020-04-08 00:42:06 -0400	[diff] [blame]	356	DstTy->isVectorTy() ? DstTy->getVectorElementType() : DstTy;
David Neto	30ae05e	2017-09-06 19:58:36 -0400	[diff] [blame]	357	// These are bit widths of the source and destination types, even
				358	// if they are vector types. E.g. bit width of float4 is 64.
David Neto	8e13814	2018-05-29 10:19:21 -0400	[diff] [blame]	359	unsigned SrcTyBitWidth = DL.getTypeStoreSizeInBits(SrcTy);
				360	unsigned DstTyBitWidth = DL.getTypeStoreSizeInBits(DstTy);
				361	unsigned SrcEleTyBitWidth = DL.getTypeStoreSizeInBits(SrcEleTy);
				362	unsigned DstEleTyBitWidth = DL.getTypeStoreSizeInBits(DstEleTy);
David Neto	22f144c	2017-06-12 14:26:21 -0400	[diff] [blame]	363	unsigned NumIter = CalculateNumIter(SrcTyBitWidth, DstTyBitWidth);
				364
				365	// Investigate pointer bitcast's users.
				366	for (User *BitCastUser : Inst->users()) {
				367	Value *BitCastSrc = Inst->getOperand(0);
				368	Value *NewAddrIdx = ConstantInt::get(Type::getInt32Ty(M.getContext()), 0);
				369
				370	// It consist of User* and bool whether user is gep or not.
				371	SmallVector<std::pair<User *, bool>, 32> Users;
				372
				373	GetElementPtrInst *GEP = nullptr;
				374	Value *OrgGEPIdx = nullptr;
Jason Gavris	e44af07	2018-08-14 20:44:50 -0400	[diff] [blame]	375	if ((GEP = dyn_cast<GetElementPtrInst>(BitCastUser))) {
David Neto	22f144c	2017-06-12 14:26:21 -0400	[diff] [blame]	376	OrgGEPIdx = GEP->getOperand(1);
				377
				378	// Build new src/dst address index.
				379	NewAddrIdx = CalculateNewGEPIdx(SrcTyBitWidth, DstTyBitWidth, GEP);
				380
				381	// Record gep's users.
				382	for (User *GEPUser : GEP->users()) {
				383	Users.push_back(std::make_pair(GEPUser, true));
				384	}
				385	} else {
				386	// Record bitcast's users.
				387	Users.push_back(std::make_pair(BitCastUser, false));
				388	}
				389
				390	// Handle users.
				391	bool IsGEPUser = false;
				392	for (auto UserIter : Users) {
				393	User *U = UserIter.first;
				394	IsGEPUser = UserIter.second;
				395
				396	IRBuilder<> Builder(cast<Instruction>(U));
				397
				398	if (StoreInst *ST = dyn_cast<StoreInst>(U)) {
				399	if (SrcTyBitWidth < DstTyBitWidth) {
				400	//
				401	// Consider below case.
				402	//
				403	// Original IR (float2* --> float4*)
				404	// 1. val = load (float4*) src_addr
				405	// 2. dst_addr = bitcast float2, float4
				406	// 3. dst_addr = gep (float4*) dst_addr, idx
				407	// 4. store (float4*) dst_addr
				408	//
				409	// Transformed IR
				410	// 1. val(float4) = load (float4*) src_addr
				411	// 2. val1(float2) = shufflevector (float4)val, (float4)undef,
				412	// (float2)<0, 1>
				413	// 3. val2(float2) = shufflevector (float4)val, (float4)undef,
				414	// (float2)<2, 3>
				415	// 4. dst_addr1(float2) = gep (float2)dst_addr, idx * 2
				416	// 5. dst_addr2(float2) = gep (float2)dst_addr, idx * 2 + 1
				417	// 6. store (float2)val1, (float2*)dst_addr1
				418	// 7. store (float2)val2, (float2*)dst_addr2
				419	//
				420
				421	unsigned NumElement = DstTyBitWidth / SrcTyBitWidth;
				422	unsigned NumVector = 1;
				423	// Vulkan SPIR-V does not support over 4 components for
				424	// TypeVector.
				425	if (NumElement > 4) {
				426	NumVector = NumElement >> 2;
				427	NumElement = 4;
				428	}
				429
				430	// Create store values.
				431	Type *TmpValTy = SrcTy;
				432	if (DstTy->isVectorTy()) {
				433	if (SrcEleTyBitWidth == DstEleTyBitWidth) {
				434	TmpValTy =
				435	VectorType::get(SrcEleTy, DstTy->getVectorNumElements());
				436	} else {
				437	TmpValTy = VectorType::get(SrcEleTy, NumElement);
				438	}
				439	}
				440
				441	Value *STVal = ST->getValueOperand();
				442	for (unsigned VIdx = 0; VIdx < NumVector; VIdx++) {
				443	Value *TmpSTVal = nullptr;
				444	if (NumVector == 1) {
				445	TmpSTVal = Builder.CreateBitCast(STVal, TmpValTy);
				446	} else {
				447	unsigned DstVecTyNumElement =
				448	DstTy->getVectorNumElements() / NumVector;
				449	SmallVector<uint32_t, 4> Idxs;
				450	for (unsigned i = 0; i < DstVecTyNumElement; i++) {
				451	Idxs.push_back(i + (DstVecTyNumElement * VIdx));
				452	}
				453	Value *UndefVal = UndefValue::get(DstTy);
				454	TmpSTVal = Builder.CreateShuffleVector(STVal, UndefVal, Idxs);
				455	TmpSTVal = Builder.CreateBitCast(TmpSTVal, TmpValTy);
				456	}
				457
				458	SmallVector<Value *, 8> STValues;
				459	if (!SrcTy->isVectorTy()) {
				460	// Handle scalar type.
				461	for (unsigned i = 0; i < NumElement; i++) {
				462	Value *TmpVal = Builder.CreateExtractElement(
				463	TmpSTVal, Builder.getInt32(i));
				464	STValues.push_back(TmpVal);
				465	}
				466	} else {
				467	// Handle vector type.
				468	unsigned SrcNumElement = SrcTy->getVectorNumElements();
				469	unsigned DstNumElement = DstTy->getVectorNumElements();
				470	for (unsigned i = 0; i < NumElement; i++) {
				471	SmallVector<uint32_t, 4> Idxs;
				472	for (unsigned j = 0; j < SrcNumElement; j++) {
				473	Idxs.push_back(i * SrcNumElement + j);
				474	}
				475
				476	VectorType *TmpVecTy =
				477	VectorType::get(SrcEleTy, DstNumElement);
				478	Value *UndefVal = UndefValue::get(TmpVecTy);
				479	Value *TmpVal =
				480	Builder.CreateShuffleVector(TmpSTVal, UndefVal, Idxs);
				481	STValues.push_back(TmpVal);
				482	}
				483	}
				484
				485	// Generate stores.
				486	Value *SrcAddrIdx = NewAddrIdx;
				487	Value *BaseAddr = BitCastSrc;
				488	for (unsigned i = 0; i < NumElement; i++) {
				489	// Calculate store address.
				490	Value *DstAddr = Builder.CreateGEP(BaseAddr, SrcAddrIdx);
				491	Builder.CreateStore(STValues[i], DstAddr);
				492
				493	if (i + 1 < NumElement) {
				494	// Calculate next store address
				495	SrcAddrIdx =
				496	Builder.CreateAdd(SrcAddrIdx, Builder.getInt32(1));
				497	}
				498	}
				499	}
				500	} else if (SrcTyBitWidth > DstTyBitWidth) {
				501	//
				502	// Consider below case.
				503	//
				504	// Original IR (float4* --> float2*)
				505	// 1. val = load (float2*) src_addr
				506	// 2. dst_addr = bitcast float4, float2
				507	// 3. dst_addr = gep (float2*) dst_addr, idx
				508	// 4. store (float2) val, (float2*) dst_addr
				509	//
Diego Novillo	3cc8d7a	2019-04-10 13:30:34 -0400	[diff] [blame]	510	// Transformed IR: Decompose the source vector into elements, then
				511	// write them one at a time.
David Neto	22f144c	2017-06-12 14:26:21 -0400	[diff] [blame]	512	// 1. val = load (float2*) src_addr
				513	// 2. val1 = (float)extract_element val, 0
				514	// 3. val2 = (float)extract_element val, 1
David Neto	30ae05e	2017-09-06 19:58:36 -0400	[diff] [blame]	515	// // Source component k maps to destination component k * idxscale
				516	// 3a. idxscale = sizeof(float4)/sizeof(float2)
				517	// 3b. idxbase = idx / idxscale
				518	// 3c. newarrayidx = idxbase * idxscale
				519	// 4. dst_addr1 = gep (float4*) dst, newarrayidx
				520	// 5. dst_addr2 = gep (float4*) dst, newarrayidx + 1
David Neto	22f144c	2017-06-12 14:26:21 -0400	[diff] [blame]	521	// 6. store (float)val1, (float*) dst_addr1
				522	// 7. store (float)val2, (float*) dst_addr2
				523	//
				524
				525	if (SrcTyBitWidth <= DstEleTyBitWidth) {
				526	SrcTy->print(errs());
				527	DstTy->print(errs());
				528	llvm_unreachable("Handle above src/dst type.");
				529	}
				530
				531	// Create store values.
				532	Value *STVal = ST->getValueOperand();
				533
				534	if (DstTy->isVectorTy() && (SrcEleTyBitWidth != DstTyBitWidth)) {
				535	VectorType *TmpVecTy =
				536	VectorType::get(SrcEleTy, DstTyBitWidth / SrcEleTyBitWidth);
				537	STVal = Builder.CreateBitCast(STVal, TmpVecTy);
				538	}
				539
				540	SmallVector<Value *, 8> STValues;
David Neto	30ae05e	2017-09-06 19:58:36 -0400	[diff] [blame]	541	// How many destination writes are required?
David Neto	22f144c	2017-06-12 14:26:21 -0400	[diff] [blame]	542	unsigned DstNumElement = 1;
				543	if (!DstTy->isVectorTy() \|\| SrcEleTyBitWidth == DstTyBitWidth) {
				544	// Handle scalar type.
				545	STValues.push_back(STVal);
				546	} else {
				547	// Handle vector type.
				548	DstNumElement = DstTy->getVectorNumElements();
				549	for (unsigned i = 0; i < DstNumElement; i++) {
				550	Value *Idx = Builder.getInt32(i);
				551	Value *TmpVal = Builder.CreateExtractElement(STVal, Idx);
				552	STValues.push_back(TmpVal);
				553	}
				554	}
				555
				556	// Generate stores.
				557	Value *BaseAddr = BitCastSrc;
				558	Value *SubEleIdx = Builder.getInt32(0);
				559	if (IsGEPUser) {
David Neto	30ae05e	2017-09-06 19:58:36 -0400	[diff] [blame]	560	// Compute SubNumElement = idxscale
David Neto	22f144c	2017-06-12 14:26:21 -0400	[diff] [blame]	561	unsigned SubNumElement = SrcTy->getVectorNumElements();
				562	if (DstTy->isVectorTy() && (SrcEleTyBitWidth != DstTyBitWidth)) {
David Neto	30ae05e	2017-09-06 19:58:36 -0400	[diff] [blame]	563	// Same condition under which DstNumElements > 1
David Neto	22f144c	2017-06-12 14:26:21 -0400	[diff] [blame]	564	SubNumElement = SrcTy->getVectorNumElements() /
				565	DstTy->getVectorNumElements();
				566	}
				567
David Neto	30ae05e	2017-09-06 19:58:36 -0400	[diff] [blame]	568	// Compute SubEleIdx = idxbase * idxscale
David Neto	22f144c	2017-06-12 14:26:21 -0400	[diff] [blame]	569	SubEleIdx = Builder.CreateAnd(
				570	OrgGEPIdx, Builder.getInt32(SubNumElement - 1));
David Neto	30ae05e	2017-09-06 19:58:36 -0400	[diff] [blame]	571	if (DstTy->isVectorTy() && (SrcEleTyBitWidth != DstTyBitWidth)) {
				572	SubEleIdx = Builder.CreateShl(
				573	SubEleIdx, Builder.getInt32(std::log2(SubNumElement)));
				574	}
David Neto	22f144c	2017-06-12 14:26:21 -0400	[diff] [blame]	575	}
				576
				577	for (unsigned i = 0; i < DstNumElement; i++) {
				578	// Calculate address.
				579	if (i > 0) {
				580	SubEleIdx = Builder.CreateAdd(SubEleIdx, Builder.getInt32(i));
				581	}
				582
				583	Value *Idxs[] = {NewAddrIdx, SubEleIdx};
				584	Value *DstAddr = Builder.CreateGEP(BaseAddr, Idxs);
				585	Type *TmpSrcTy = SrcEleTy;
				586	if (TmpSrcTy->isVectorTy()) {
				587	TmpSrcTy = TmpSrcTy->getVectorElementType();
				588	}
				589	Value *TmpVal = Builder.CreateBitCast(STValues[i], TmpSrcTy);
				590
				591	Builder.CreateStore(TmpVal, DstAddr);
				592	}
				593	} else {
				594	// if SrcTyBitWidth == DstTyBitWidth
				595	Type *TmpSrcTy = SrcTy;
				596	Value *DstAddr = Src;
				597
				598	if (IsGEPUser) {
				599	SmallVector<Value *, 4> Idxs;
				600	for (unsigned i = 1; i < GEP->getNumOperands(); i++) {
				601	Idxs.push_back(GEP->getOperand(i));
				602	}
				603	DstAddr = Builder.CreateGEP(BitCastSrc, Idxs);
				604
				605	if (GEP->getNumOperands() > 2) {
				606	TmpSrcTy = SrcEleTy;
				607	}
				608	}
				609
				610	Value *TmpVal =
				611	Builder.CreateBitCast(ST->getValueOperand(), TmpSrcTy);
				612	Builder.CreateStore(TmpVal, DstAddr);
				613	}
				614	} else if (LoadInst *LD = dyn_cast<LoadInst>(U)) {
				615	Value *SrcAddrIdx = Builder.getInt32(0);
				616	if (IsGEPUser) {
				617	SrcAddrIdx = NewAddrIdx;
				618	}
				619
				620	// Load value from src.
				621	SmallVector<Value *, 8> LDValues;
				622
				623	for (unsigned i = 1; i <= NumIter; i++) {
				624	Value *SrcAddr = Builder.CreateGEP(Src, SrcAddrIdx);
				625	LoadInst *SrcVal = Builder.CreateLoad(SrcAddr, "src_val");
				626	LDValues.push_back(SrcVal);
				627
				628	if (i + 1 <= NumIter) {
				629	// Calculate next SrcAddrIdx.
				630	SrcAddrIdx = Builder.CreateAdd(SrcAddrIdx, Builder.getInt32(1));
				631	}
				632	}
				633
				634	Value *DstVal = nullptr;
				635	if (SrcTyBitWidth > DstTyBitWidth) {
				636	unsigned NumElement = SrcTyBitWidth / DstTyBitWidth;
				637
				638	if (SrcEleTyBitWidth == DstTyBitWidth) {
				639	//
				640	// Consider below case.
				641	//
				642	// Original IR (int4* --> char4*)
				643	// 1. src_addr = bitcast int4, char4
				644	// 2. element_addr = gep (char4*) src_addr, idx
				645	// 3. load (char4*) element_addr
				646	//
				647	// Transformed IR
				648	// 1. src_addr = gep (int4*) src, idx / 4
				649	// 2. src_val(int4) = load (int4*) src_addr
				650	// 3. tmp_val(int4) = extractelement src_val, idx % 4
				651	// 4. dst_val(char4) = bitcast tmp_val, (char4)
				652	//
				653	Value *EleIdx = Builder.getInt32(0);
				654	if (IsGEPUser) {
				655	EleIdx = Builder.CreateAnd(OrgGEPIdx,
				656	Builder.getInt32(NumElement - 1));
				657	}
				658	Value *TmpVal =
				659	Builder.CreateExtractElement(LDValues[0], EleIdx, "tmp_val");
				660	DstVal = Builder.CreateBitCast(TmpVal, DstTy);
				661	} else if (SrcEleTyBitWidth < DstTyBitWidth) {
				662	if (IsGEPUser) {
				663	//
				664	// Consider below case.
				665	//
				666	// Original IR (float4* --> float2*)
				667	// 1. src_addr = bitcast float4, float2
				668	// 2. element_addr = gep (float2*) src_addr, idx
				669	// 3. load (float2*) element_addr
				670	//
				671	// Transformed IR
				672	// 1. src_addr = gep (float4*) src, idx / 2
				673	// 2. src_val(float4) = load (float4*) src_addr
				674	// 3. tmp_val1(float) = extractelement (idx % 2) * 2
				675	// 4. tmp_val2(float) = extractelement (idx % 2) * 2 + 1
				676	// 5. dst_val(float2) = insertelement undef(float2), tmp_val1, 0
				677	// 6. dst_val(float2) = insertelement undef(float2), tmp_val2, 1
				678	// 7. dst_val(float2) = bitcast dst_val, (float2)
				679	// ==> if types are same between src and dst, it will be
				680	// igonored
				681	//
				682	VectorType *TmpVecTy =
				683	VectorType::get(SrcEleTy, DstTyBitWidth / SrcEleTyBitWidth);
				684	DstVal = UndefValue::get(TmpVecTy);
				685	Value *EleIdx = Builder.CreateAnd(
				686	OrgGEPIdx, Builder.getInt32(NumElement - 1));
				687	EleIdx = Builder.CreateShl(
				688	EleIdx, Builder.getInt32(
				689	std::log2(DstTyBitWidth / SrcEleTyBitWidth)));
				690	Value *TmpOrgGEPIdx = EleIdx;
				691	for (unsigned i = 0; i < NumElement; i++) {
				692	Value *TmpVal = Builder.CreateExtractElement(
				693	LDValues[0], TmpOrgGEPIdx, "tmp_val");
				694	DstVal = Builder.CreateInsertElement(DstVal, TmpVal,
				695	Builder.getInt32(i));
				696
				697	if (i + 1 < NumElement) {
				698	TmpOrgGEPIdx =
				699	Builder.CreateAdd(TmpOrgGEPIdx, Builder.getInt32(1));
				700	}
				701	}
				702	} else {
				703	//
				704	// Consider below case.
				705	//
				706	// Original IR (float4* --> int2*)
				707	// 1. src_addr = bitcast float4, int2
				708	// 2. load (int2*) src_addr
				709	//
				710	// Transformed IR
				711	// 1. src_val(float4) = load (float4*) src_addr
				712	// 2. tmp_val(float2) = shufflevector (float4)src_val,
				713	// (float4)undef,
				714	// (float2)<0, 1>
				715	// 3. dst_val(int2) = bitcast (float2)tmp_val, (int2)
				716	//
				717	unsigned NumElement = DstTyBitWidth / SrcEleTyBitWidth;
				718	Value *Undef = UndefValue::get(SrcTy);
				719
				720	SmallVector<uint32_t, 4> Idxs;
				721	for (unsigned i = 0; i < NumElement; i++) {
				722	Idxs.push_back(i);
				723	}
				724	DstVal = Builder.CreateShuffleVector(LDValues[0], Undef, Idxs);
				725
				726	DstVal = Builder.CreateBitCast(DstVal, DstTy);
				727	}
				728
				729	DstVal = Builder.CreateBitCast(DstVal, DstTy);
				730	} else {
				731	if (IsGEPUser) {
				732	//
				733	// Consider below case.
				734	//
				735	// Original IR (int4* --> char2*)
				736	// 1. src_addr = bitcast int4, char2
				737	// 2. element_addr = gep (char2*) src_addr, idx
				738	// 3. load (char2*) element_addr
				739	//
				740	// Transformed IR
				741	// 1. src_addr = gep (int4*) src, idx / 8
				742	// 2. src_val(int4) = load (int4*) src_addr
				743	// 3. tmp_val(int) = extractelement idx / 2
				744	// 4. tmp_val(<i16 x 2>) = bitcast tmp_val(int), (<i16 x 2>)
				745	// 5. tmp_val(i16) = extractelement idx % 2
				746	// 6. dst_val(char2) = bitcast tmp_val, (char2)
				747	// ==> if types are same between src and dst, it will be
				748	// igonored
				749	//
				750	unsigned NumElement = SrcTyBitWidth / DstTyBitWidth;
				751	unsigned SubNumElement = SrcEleTyBitWidth / DstTyBitWidth;
				752	if (SubNumElement != 2 && SubNumElement != 4) {
				753	llvm_unreachable("Unsupported SubNumElement");
				754	}
				755
				756	Value *TmpOrgGEPIdx = Builder.CreateLShr(
				757	OrgGEPIdx, Builder.getInt32(std::log2(SubNumElement)));
				758	Value *TmpVal = Builder.CreateExtractElement(
				759	LDValues[0], TmpOrgGEPIdx, "tmp_val");
				760	TmpVal = Builder.CreateBitCast(
				761	TmpVal,
				762	VectorType::get(
				763	IntegerType::get(DstTy->getContext(), DstTyBitWidth),
				764	SubNumElement));
				765	TmpOrgGEPIdx = Builder.CreateAnd(
				766	OrgGEPIdx, Builder.getInt32(SubNumElement - 1));
				767	TmpVal = Builder.CreateExtractElement(TmpVal, TmpOrgGEPIdx,
				768	"tmp_val");
				769	DstVal = Builder.CreateBitCast(TmpVal, DstTy);
				770	} else {
				771	Inst->print(errs());
				772	llvm_unreachable("Handle this bitcast");
				773	}
				774	}
				775	} else if (SrcTyBitWidth < DstTyBitWidth) {
				776	//
				777	// Consider below case.
				778	//
				779	// Original IR (float2* --> float4*)
				780	// 1. src_addr = bitcast float2, float4
				781	// 2. element_addr = gep (float4*) src_addr, idx
				782	// 3. load (float4*) element_addr
				783	//
				784	// Transformed IR
				785	// 1. src_addr = gep (float2) src, idx 2
				786	// 2. src_val1(float2) = load (float2*) src_addr
				787	// 3. src_addr2 = gep (float2*) src_addr, 1
				788	// 4. src_val2(float2) = load (float2*) src_addr2
				789	// 5. dst_val(float4) = shufflevector src_val1, src_val2, <0, 1>
				790	// 6. dst_val(float4) = bitcast dst_val, (float4)
				791	// ==> if types are same between src and dst, it will be igonored
				792	//
				793	unsigned NumElement = 1;
				794	if (SrcTy->isVectorTy()) {
				795	NumElement = SrcTy->getVectorNumElements() * 2;
				796	}
				797
				798	// Handle scalar type.
				799	if (NumElement == 1) {
				800	if (SrcTyBitWidth * 4 <= DstTyBitWidth) {
				801	unsigned NumVecElement = DstTyBitWidth / SrcTyBitWidth;
				802	unsigned NumVector = 1;
				803	if (NumVecElement > 4) {
				804	NumVector = NumVecElement >> 2;
				805	NumVecElement = 4;
				806	}
				807
				808	SmallVector<Value *, 4> Values;
				809	for (unsigned VIdx = 0; VIdx < NumVector; VIdx++) {
				810	// In this case, generate only insert element. It generates
				811	// less instructions than using shuffle vector.
				812	VectorType *TmpVecTy = VectorType::get(SrcTy, NumVecElement);
				813	Value *TmpVal = UndefValue::get(TmpVecTy);
				814	for (unsigned i = 0; i < NumVecElement; i++) {
				815	TmpVal = Builder.CreateInsertElement(
				816	TmpVal, LDValues[i + (VIdx * 4)], Builder.getInt32(i));
				817	}
				818	Values.push_back(TmpVal);
				819	}
				820
				821	if (Values.size() > 2) {
				822	Inst->print(errs());
				823	llvm_unreachable("Support above bitcast");
				824	}
				825
				826	if (Values.size() > 1) {
				827	Type *TmpEleTy =
				828	Type::getIntNTy(M.getContext(), SrcEleTyBitWidth * 2);
				829	VectorType *TmpVecTy = VectorType::get(TmpEleTy, NumVector);
				830	for (unsigned i = 0; i < Values.size(); i++) {
				831	Values[i] = Builder.CreateBitCast(Values[i], TmpVecTy);
				832	}
				833	SmallVector<uint32_t, 4> Idxs;
				834	for (unsigned i = 0; i < (NumVector * 2); i++) {
				835	Idxs.push_back(i);
				836	}
				837	for (unsigned i = 0; i < Values.size(); i = i + 2) {
				838	Values[i] = Builder.CreateShuffleVector(
				839	Values[i], Values[i + 1], Idxs);
				840	}
				841	}
				842
				843	LDValues.clear();
				844	LDValues.push_back(Values[0]);
				845	} else {
				846	SmallVector<Value *, 4> TmpLDValues;
				847	for (unsigned i = 0; i < LDValues.size(); i = i + 2) {
				848	VectorType *TmpVecTy = VectorType::get(SrcTy, 2);
				849	Value *TmpVal = UndefValue::get(TmpVecTy);
				850	TmpVal = Builder.CreateInsertElement(TmpVal, LDValues[i],
				851	Builder.getInt32(0));
				852	TmpVal = Builder.CreateInsertElement(TmpVal, LDValues[i + 1],
				853	Builder.getInt32(1));
				854	TmpLDValues.push_back(TmpVal);
				855	}
				856	LDValues.clear();
				857	LDValues = std::move(TmpLDValues);
				858	NumElement = 4;
				859	}
				860	}
				861
				862	// Handle vector type.
				863	while (LDValues.size() != 1) {
				864	SmallVector<Value *, 4> TmpLDValues;
				865	for (unsigned i = 0; i < LDValues.size(); i = i + 2) {
				866	SmallVector<uint32_t, 4> Idxs;
				867	for (unsigned j = 0; j < NumElement; j++) {
				868	Idxs.push_back(j);
				869	}
				870	Value *TmpVal = Builder.CreateShuffleVector(
				871	LDValues[i], LDValues[i + 1], Idxs);
				872	TmpLDValues.push_back(TmpVal);
				873	}
				874	LDValues.clear();
				875	LDValues = std::move(TmpLDValues);
				876	NumElement *= 2;
				877	}
				878
				879	DstVal = Builder.CreateBitCast(LDValues[0], DstTy);
				880	} else {
				881	//
				882	// Consider below case.
				883	//
				884	// Original IR (float4* --> int4*)
				885	// 1. src_addr = bitcast float4, int4
				886	// 2. element_addr = gep (int4*) src_addr, idx, 0
				887	// 3. load (int) element_addr
				888	//
				889	// Transformed IR
				890	// 1. element_addr = gep (float4*) src_addr, idx, 0
				891	// 2. src_val = load (float*) element_addr
				892	// 3. val = bitcast (float) src_val to (int)
				893	//
				894	Value *SrcAddr = Src;
				895	if (IsGEPUser) {
				896	SmallVector<Value *, 4> Idxs;
				897	for (unsigned i = 1; i < GEP->getNumOperands(); i++) {
				898	Idxs.push_back(GEP->getOperand(i));
				899	}
				900	SrcAddr = Builder.CreateGEP(Src, Idxs);
				901	}
				902	LoadInst *SrcVal = Builder.CreateLoad(SrcAddr, "src_val");
				903
				904	Type *TmpDstTy = DstTy;
				905	if (IsGEPUser) {
				906	if (GEP->getNumOperands() > 2) {
				907	TmpDstTy = DstEleTy;
				908	}
				909	}
				910	DstVal = Builder.CreateBitCast(SrcVal, TmpDstTy);
				911	}
				912
				913	// Update LD's users with DstVal.
				914	LD->replaceAllUsesWith(DstVal);
				915	} else {
				916	U->print(errs());
				917	llvm_unreachable(
				918	"Handle above user of gep on ReplacePointerBitcastPass");
				919	}
				920
				921	ToBeDeleted.push_back(cast<Instruction>(U));
				922	}
				923
				924	if (IsGEPUser) {
				925	ToBeDeleted.push_back(GEP);
				926	}
				927	}
				928
				929	ToBeDeleted.push_back(Inst);
				930	}
				931
				932	for (Instruction *Inst : ScalarWorkList) {
David Neto	8e13814	2018-05-29 10:19:21 -0400	[diff] [blame]	933	// Some tests have a stray bitcast from pointer-to-array to
				934	// pointer to i8*, but the bitcast has no uses. Exit early
				935	// but be sure to delete it later.
				936	//
				937	// Example:
				938	// %1 = bitcast [25 x float]* %dst to i8*
				939
				940	// errs () << " Scalar bitcast is " << *Inst << "\n";
				941
				942	if (!Inst->hasNUsesOrMore(1)) {
				943	ToBeDeleted.push_back(Inst);
				944	continue;
				945	}
				946
David Neto	22f144c	2017-06-12 14:26:21 -0400	[diff] [blame]	947	Value *Src = Inst->getOperand(0);
David Neto	8e13814	2018-05-29 10:19:21 -0400	[diff] [blame]	948	Type *SrcTy; // Original type
				949	Type *DstTy; // Type that SrcTy is cast to.
				950	unsigned SrcTyBitWidth;
				951	unsigned DstTyBitWidth;
				952
alan-baker	1b13e8f	2019-08-08 17:56:51 -0400	[diff] [blame]	953	bool BailOut = false;
David Neto	8e13814	2018-05-29 10:19:21 -0400	[diff] [blame]	954	SrcTy = Src->getType()->getPointerElementType();
				955	DstTy = Inst->getType()->getPointerElementType();
				956	int iter_count = 0;
				957	while (++iter_count) {
				958	SrcTyBitWidth = unsigned(DL.getTypeStoreSizeInBits(SrcTy));
				959	DstTyBitWidth = unsigned(DL.getTypeStoreSizeInBits(DstTy));
				960	#if 0
				961	errs() << " Try Src " << *Src << "\n";
				962	errs() << " SrcTy elem " << *SrcTy << " bit width " << SrcTyBitWidth
				963	<< "\n";
				964	errs() << " DstTy elem " << *DstTy << " bit width " << DstTyBitWidth
				965	<< "\n";
				966	#endif
				967
				968	// The normal case that we can handle is source type is smaller than
				969	// the dest type.
				970	if (SrcTyBitWidth <= DstTyBitWidth)
				971	break;
				972
				973	// The Source type is bigger than the destination type.
				974	// Walk into the source type to break it down.
				975	if (SrcTy->isArrayTy()) {
				976	// If it's an array, consider only the first element.
				977	Value *Zero = ConstantInt::get(Type::getInt32Ty(M.getContext()), 0);
Diego Novillo	3cc8d7a	2019-04-10 13:30:34 -0400	[diff] [blame]	978	Instruction *NewSrc =
				979	GetElementPtrInst::CreateInBounds(Src, {Zero, Zero});
alan-baker	1b13e8f	2019-08-08 17:56:51 -0400	[diff] [blame]	980	Changed = true;
David Neto	8e13814	2018-05-29 10:19:21 -0400	[diff] [blame]	981	// errs() << "NewSrc is " << *NewSrc << "\n";
				982	if (auto *SrcInst = dyn_cast<Instruction>(Src)) {
				983	// errs() << " instruction case\n";
				984	NewSrc->insertAfter(SrcInst);
				985	} else {
				986	// Could be a parameter.
				987	auto where = Inst->getParent()
				988	->getParent()
				989	->getEntryBlock()
				990	.getFirstInsertionPt();
Diego Novillo	3cc8d7a	2019-04-10 13:30:34 -0400	[diff] [blame]	991	Instruction &whereInst = *where;
David Neto	8e13814	2018-05-29 10:19:21 -0400	[diff] [blame]	992	// errs() << "insert " << *NewSrc << " before " << whereInst << "\n";
				993	NewSrc->insertBefore(&whereInst);
				994	}
				995	Src = NewSrc;
				996	SrcTy = Src->getType()->getPointerElementType();
				997	} else {
alan-baker	1b13e8f	2019-08-08 17:56:51 -0400	[diff] [blame]	998	BailOut = true;
				999	break;
David Neto	8e13814	2018-05-29 10:19:21 -0400	[diff] [blame]	1000	}
				1001	if (iter_count > 1000) {
				1002	llvm_unreachable("ReplacePointerBitcastPass: Too many iterations!");
				1003	}
				1004	};
				1005	#if 0
				1006	errs() << " Src is " << *Src << "\n";
				1007	errs() << " Dst is " << *Inst << "\n";
				1008	errs() << " SrcTy elem " << *SrcTy << " bit width " << SrcTyBitWidth
				1009	<< "\n";
				1010	errs() << " DstTy elem " << *DstTy << " bit width " << DstTyBitWidth
				1011	<< "\n";
				1012	#endif
David Neto	22f144c	2017-06-12 14:26:21 -0400	[diff] [blame]	1013
alan-baker	1b13e8f	2019-08-08 17:56:51 -0400	[diff] [blame]	1014	// Only dead code has been generated up to this point so it is safe to bail
				1015	// out.
				1016	if (BailOut) {
				1017	continue;
				1018	}
				1019
David Neto	22f144c	2017-06-12 14:26:21 -0400	[diff] [blame]	1020	for (User *BitCastUser : Inst->users()) {
				1021	Value *NewAddrIdx = ConstantInt::get(Type::getInt32Ty(M.getContext()), 0);
				1022	// It consist of User* and bool whether user is gep or not.
				1023	SmallVector<std::pair<User *, bool>, 32> Users;
				1024
				1025	GetElementPtrInst *GEP = nullptr;
				1026	Value *OrgGEPIdx = nullptr;
Jason Gavris	e44af07	2018-08-14 20:44:50 -0400	[diff] [blame]	1027	if ((GEP = dyn_cast<GetElementPtrInst>(BitCastUser))) {
David Neto	22f144c	2017-06-12 14:26:21 -0400	[diff] [blame]	1028	IRBuilder<> Builder(GEP);
				1029
				1030	// Build new src/dst address.
				1031	OrgGEPIdx = GEP->getOperand(1);
				1032	NewAddrIdx = CalculateNewGEPIdx(SrcTyBitWidth, DstTyBitWidth, GEP);
				1033
				1034	// If bitcast's user is gep, investigate gep's users too.
				1035	for (User *GEPUser : GEP->users()) {
				1036	Users.push_back(std::make_pair(GEPUser, true));
				1037	}
				1038	} else {
				1039	Users.push_back(std::make_pair(BitCastUser, false));
				1040	}
				1041
				1042	// Handle users.
				1043	bool IsGEPUser = false;
				1044	for (auto UserIter : Users) {
				1045	User *U = UserIter.first;
				1046	IsGEPUser = UserIter.second;
				1047
				1048	IRBuilder<> Builder(cast<Instruction>(U));
				1049
				1050	// Handle store instruction with gep.
				1051	if (StoreInst *ST = dyn_cast<StoreInst>(U)) {
Diego Novillo	3cc8d7a	2019-04-10 13:30:34 -0400	[diff] [blame]	1052	// errs() << " store is " << *ST << "\n";
David Neto	22f144c	2017-06-12 14:26:21 -0400	[diff] [blame]	1053	if (SrcTyBitWidth == DstTyBitWidth) {
alan-baker	3201427	2019-05-22 08:07:18 -0400	[diff] [blame]	1054	auto STVal = ConvertValue(ST->getValueOperand(), SrcTy, Builder);
David Neto	22f144c	2017-06-12 14:26:21 -0400	[diff] [blame]	1055	Value *DstAddr = Builder.CreateGEP(Src, NewAddrIdx);
				1056	Builder.CreateStore(STVal, DstAddr);
				1057	} else if (SrcTyBitWidth < DstTyBitWidth) {
				1058	unsigned NumElement = DstTyBitWidth / SrcTyBitWidth;
				1059
David Neto	22f144c	2017-06-12 14:26:21 -0400	[diff] [blame]	1060	// Create store values.
				1061	Value *STVal = ST->getValueOperand();
				1062	SmallVector<Value *, 8> STValues;
				1063	for (unsigned i = 0; i < NumElement; i++) {
				1064	Type *TmpTy = Type::getIntNTy(M.getContext(), DstTyBitWidth);
				1065	Value *TmpVal = Builder.CreateBitCast(STVal, TmpTy);
James Price	5195228	2020-02-14 09:41:11 -0500	[diff] [blame]	1066	TmpVal = Builder.CreateLShr(
				1067	TmpVal, Builder.getIntN(DstTyBitWidth, i * SrcTyBitWidth));
David Neto	22f144c	2017-06-12 14:26:21 -0400	[diff] [blame]	1068	TmpVal = Builder.CreateTrunc(TmpVal, SrcTy);
				1069	STValues.push_back(TmpVal);
				1070	}
				1071
				1072	// Generate stores.
				1073	Value *SrcAddrIdx = NewAddrIdx;
				1074	Value *BaseAddr = Src;
				1075	for (unsigned i = 0; i < NumElement; i++) {
				1076	// Calculate store address.
				1077	Value *DstAddr = Builder.CreateGEP(BaseAddr, SrcAddrIdx);
				1078	Builder.CreateStore(STValues[i], DstAddr);
				1079
				1080	if (i + 1 < NumElement) {
				1081	// Calculate next store address
				1082	SrcAddrIdx = Builder.CreateAdd(SrcAddrIdx, Builder.getInt32(1));
				1083	}
				1084	}
				1085
				1086	} else {
				1087	Inst->print(errs());
				1088	llvm_unreachable("Handle different size store with scalar "
				1089	"bitcast on ReplacePointerBitcastPass");
				1090	}
				1091	} else if (LoadInst *LD = dyn_cast<LoadInst>(U)) {
				1092	if (SrcTyBitWidth == DstTyBitWidth) {
				1093	Value *SrcAddr = Builder.CreateGEP(Src, NewAddrIdx);
				1094	LoadInst *SrcVal = Builder.CreateLoad(SrcAddr, "src_val");
alan-baker	3201427	2019-05-22 08:07:18 -0400	[diff] [blame]	1095	LD->replaceAllUsesWith(ConvertValue(SrcVal, DstTy, Builder));
David Neto	22f144c	2017-06-12 14:26:21 -0400	[diff] [blame]	1096	} else if (SrcTyBitWidth < DstTyBitWidth) {
				1097	Value *SrcAddrIdx = NewAddrIdx;
				1098
				1099	// Load value from src.
				1100	unsigned NumIter = CalculateNumIter(SrcTyBitWidth, DstTyBitWidth);
				1101	SmallVector<Value *, 8> LDValues;
				1102	for (unsigned i = 1; i <= NumIter; i++) {
				1103	Value *SrcAddr = Builder.CreateGEP(Src, SrcAddrIdx);
				1104	LoadInst *SrcVal = Builder.CreateLoad(SrcAddr, "src_val");
				1105	LDValues.push_back(SrcVal);
				1106
				1107	if (i + 1 <= NumIter) {
				1108	// Calculate next SrcAddrIdx.
				1109	SrcAddrIdx = Builder.CreateAdd(SrcAddrIdx, Builder.getInt32(1));
				1110	}
				1111	}
				1112
				1113	// Merge Load.
				1114	Type *TmpSrcTy = Type::getIntNTy(M.getContext(), SrcTyBitWidth);
				1115	Value *DstVal = Builder.CreateBitCast(LDValues[0], TmpSrcTy);
				1116	Type *TmpDstTy = Type::getIntNTy(M.getContext(), DstTyBitWidth);
				1117	DstVal = Builder.CreateZExt(DstVal, TmpDstTy);
				1118	for (unsigned i = 1; i < LDValues.size(); i++) {
				1119	Value *TmpVal = Builder.CreateBitCast(LDValues[i], TmpSrcTy);
				1120	TmpVal = Builder.CreateZExt(TmpVal, TmpDstTy);
Kévin Petit	0c9cd04	2020-04-06 17:32:41 +0100	[diff] [blame]	1121	TmpVal = Builder.CreateShl(
				1122	TmpVal, Builder.getIntN(DstTyBitWidth, i * SrcTyBitWidth));
David Neto	22f144c	2017-06-12 14:26:21 -0400	[diff] [blame]	1123	DstVal = Builder.CreateOr(DstVal, TmpVal);
				1124	}
				1125
				1126	DstVal = Builder.CreateBitCast(DstVal, DstTy);
				1127	LD->replaceAllUsesWith(DstVal);
				1128
				1129	} else {
				1130	Inst->print(errs());
				1131	llvm_unreachable("Handle different size load with scalar "
				1132	"bitcast on ReplacePointerBitcastPass");
				1133	}
				1134	} else {
David Neto	22f144c	2017-06-12 14:26:21 -0400	[diff] [blame]	1135	Inst->print(errs());
				1136	llvm_unreachable("Handle above user of scalar bitcast with gep on "
				1137	"ReplacePointerBitcastPass");
				1138	}
				1139
				1140	ToBeDeleted.push_back(cast<Instruction>(U));
				1141	}
				1142
				1143	if (IsGEPUser) {
				1144	ToBeDeleted.push_back(GEP);
				1145	}
				1146	}
				1147
				1148	ToBeDeleted.push_back(Inst);
				1149	}
				1150
				1151	for (Instruction *Inst : ToBeDeleted) {
				1152	Inst->eraseFromParent();
				1153	}
				1154
				1155	return Changed;
				1156	}